La compañía presenta su nuevo modelo con el aval de haber superado a sus rivales en prácticamente todas las pruebas. Es la primera vez en un año que alguien demuestra poder superar las capacidades de la empresa de Sam Altman
Una vez la crisis de OpenAI parece haber sido cerrada con el regreso y la victoria de Altman, el gremio de la inteligencia artificial vuelve a dar que hablar por lo habitual, que no es otra cosa que la carrera armamentística que se vive desde hace meses por ver qué empresa es la que consigue llevarse el gato al agua y liderar esta tecnología. La última en mover pieza ha sido Google. La empresa dirigida por Sundar Pichai tiene una nueva IA llamada Gemini, la más poderosa y capaz que han desarrollado en los cuarteles generales del buscador, que ha sido presentada este miércoles. Todo esto pretende ser un punto de inflexión en la competición que mantiene la multinacional con Microsoft y OpenAI, ya que este lanzamiento llega con el aval de haber superado a todos sus rivales en la mayoría de las pruebas que se realizan para analizar las capacidades de los modelos de lenguaje que luego dan vida a todas estas IA.
La compañía ha presentado a Gemini como una inteligencia artificial multimodal. Esto significa que este sistema es capaz de «trabajar, combinar y entender distintos tipos y distintos formatos de información», desde texto o imágenes hasta trabajar con audio, video o lenguajes de código.
¿En qué se traduce esa multimodalidad? Por ejemplo, que si la inteligencia artificial ve una foto de tomates y pasta, nos puede ofrecer una receta para cocinarlos; si ve una foto de dos ovillos de lana puede darnos consejos para hacer ganchillo y mientras analiza un video puede darnos canciones que pegan con esas imágenes. Que sea capaz de hacerlo, no significa que lo vaya a hacer desde el primer momento. Google vuelve a optar por la prudencia y en esta primera fase, Gemini solo responderá con texto o código.