Tecnología

Google lanza Gemini, su modelo de IA más poderoso y que rivalizará con GPT-4

La empresa destacó que esta herramienta cuenta con la capacidad de entender prácticamente cualquier tipo de instrucción y generar razonamiento complejo.

mié 06 diciembre 2023 08:00 AM

Añadir Expansión en Google

Qué es Gemini, el nuevo modelo de IA de Google — (Foto: Google)

Fernando Guarneros Olmos

@Guarolf_

La carrera por la Inteligencia Artificial cada día es más vertiginosa y la muestra más reciente de ello es que Google anunció Gemini, su modelo de IA generativa más avanzado hasta el momento y que representará el rival más importante de GPT-4.

El desarrollo de esta nueva herramienta estuvo a cargo del equipo de Google DeepMind y de acuerdo con Eli Collins, vicepresidente de producto de esta división, se trata de un sistema multimodal de forma nativa, es decir, es capaz de entender prácticamente cualquier estímulo, ya sea texto, imágenes, videos o audio.

Collins también resaltó que representa un avance en los estándares de los modelos de IA, pues Gemini tiene la capacidad de generar razonamiento conceptual, además de discernir en medio de grandes cantidades de información.

En un ejemplo que Google mostró a un grupo de periodistas internacionales, Gemini fue capaz de obtener información de fórmulas matemáticas para resolver ejercicios y explicarlos paso a paso, además de generar gráficas a partir de datos y entregar más detalles para complementar el resultado.

“Su notable capacidad para extraer información de cientos de miles de documentos a través de la lectura, el filtrado y la comprensión de la información ayudará a ofrecer nuevos avances a velocidades digitales en muchos campos, desde la ciencia hasta las finanzas”, señala la compañía.

Además de poder entender, explicar y generar audio, video, texto e imágenes, Gemini también es capaz de hacer estas acciones con código en los lenguajes de programación más populares, como Python, Java, C++ y Go.

Respecto a esto, la empresa destacó que crearon un sistema de generación de código avanzado, llamado AlphaCode 2, que cuenta con la capacidad de resolver problemas de programación que van más allá de la codificación y donde se involucran matemáticas complejas y ciencias de la computación teórica.

De acuerdo con Sundar Pichai, CEO de Google, Gemini representa “un impulso increíble” para la compañía, aunque también resaltó que sólo están “arañando la superficie de lo qu es posible”.

Gemini tendrá tres versiones y se incluirá en Bard

Google detalló que Gemini tendrá tres tamaños diferentes enfocados en cumplir con cierto tipo de labores. Por una parte, Gemini Ultra es el modelo más grande y capaz de realizar tareas muy complejas.

Gemini Pro es un modelo optimizado para escalar gamas más amplias de tareas, mientras que Gemini Nano está enfocado en eficientar las tareas de IA en los dispositivos. Con estos tres tamaños, Google destaca que se puede usar tanto en centros de datos hasta en dispositivos móviles.

Asimismo, detalló que Bard, el asistente virtual que la empresa comenzó a implementar a partir de este año para competir con ChatGPT, usará una versión de Gemini Pro en inglés para un razonamiento, planificación y comprensión más avanzados.

Según los detalles que aportó Google a la prensa, Gemini Pro superó a la versión GPT-3.5, de OpenAI, en la comprensión de insumos de diferentes tipos. Asimismo, dijo que Bard obtuvo mejores resultados en las evaluaciones a ciegas con los asesores externos de Google.

Bard con Gemini Pro está disponible para pruebas hoy mismo, aunque la empresa hizo hincapié en que sólo para obtener indicaciones basadas en texto y únicamente en inglés en más de 170 territorios.

Por otra parte, Sissie Hsiao, directora general y vicepresidenta de la unidad de negocio de Google Asistant, dijo que a inicios del próximo año se presentará Bard Advanced, con la cual se dará acceso a un asistente mucho más avanzado, pues utilizará las capacidades de Gemini Ultra.