En un ejemplo que Google mostró a un grupo de periodistas internacionales, Gemini fue capaz de obtener información de fórmulas matemáticas para resolver ejercicios y explicarlos paso a paso, además de generar gráficas a partir de datos y entregar más detalles para complementar el resultado.
“Su notable capacidad para extraer información de cientos de miles de documentos a través de la lectura, el filtrado y la comprensión de la información ayudará a ofrecer nuevos avances a velocidades digitales en muchos campos, desde la ciencia hasta las finanzas”, señala la compañía.
Además de poder entender, explicar y generar audio, video, texto e imágenes, Gemini también es capaz de hacer estas acciones con código en los lenguajes de programación más populares, como Python, Java, C++ y Go.
Respecto a esto, la empresa destacó que crearon un sistema de generación de código avanzado, llamado AlphaCode 2, que cuenta con la capacidad de resolver problemas de programación que van más allá de la codificación y donde se involucran matemáticas complejas y ciencias de la computación teórica.
De acuerdo con Sundar Pichai, CEO de Google, Gemini representa “un impulso increíble” para la compañía, aunque también resaltó que sólo están “arañando la superficie de lo qu es posible”.
Gemini tendrá tres versiones y se incluirá en Bard
Google detalló que Gemini tendrá tres tamaños diferentes enfocados en cumplir con cierto tipo de labores. Por una parte, Gemini Ultra es el modelo más grande y capaz de realizar tareas muy complejas.
Gemini Pro es un modelo optimizado para escalar gamas más amplias de tareas, mientras que Gemini Nano está enfocado en eficientar las tareas de IA en los dispositivos. Con estos tres tamaños, Google destaca que se puede usar tanto en centros de datos hasta en dispositivos móviles.
Asimismo, detalló que Bard, el asistente virtual que la empresa comenzó a implementar a partir de este año para competir con ChatGPT, usará una versión de Gemini Pro en inglés para un razonamiento, planificación y comprensión más avanzados.
Según los detalles que aportó Google a la prensa, Gemini Pro superó a la versión GPT-3.5, de OpenAI, en la comprensión de insumos de diferentes tipos. Asimismo, dijo que Bard obtuvo mejores resultados en las evaluaciones a ciegas con los asesores externos de Google.
Bard con Gemini Pro está disponible para pruebas hoy mismo, aunque la empresa hizo hincapié en que sólo para obtener indicaciones basadas en texto y únicamente en inglés en más de 170 territorios.
Por otra parte, Sissie Hsiao, directora general y vicepresidenta de la unidad de negocio de Google Asistant, dijo que a inicios del próximo año se presentará Bard Advanced, con la cual se dará acceso a un asistente mucho más avanzado, pues utilizará las capacidades de Gemini Ultra.