Además, tienen la habilidad de hacer el tipo de cosas que las personas generalmente pueden llevar a cabo con sus manos y dedos, como manipular objetos con cuidado. Por ello, Google afirma que este modelo “representa un paso sustancial en el rendimiento en los tres ejes, acercándonos a robots verdaderamente de propósito general”.

Gracias a la incorporación de Gemini, este modelo también es capaz de comprender y responder a comandos expresados en lenguaje natural en diferentes idiomas, lo cual lo hace un sistema más interactivo y colaborativo con las personas, incluso en tareas que requieren un alto nivel de precisión, como doblar un origami.

Este modelo, destacó la compañía, es adaptable a robots de diferentes tamaños y tipos, por lo que puede ser utilizado tanto en brazos robóticos con tareas específicas o bien en robots humanoides capaces de hacer labores similares a las de un humano.

Por otra parte, el segundo modelo que dio a conocer Google es Gemini Robots-ER, el cual entrega habilidades de comprensión espacial para que los robots puedan ejecutar sus propios programas utilizando las capacidades de razonamiento incorporado (ER, en inglés).

Meet Gemini Robotics: our latest AI models designed for a new generation of helpful robots. 🤖

Based on Gemini 2.0, they bring capabilities such as better reasoning, interactivity, dexterity and generalization into the physical world. 🧵 https://t.co/EXRJrmxGxl pic.twitter.com/MeEkRLomXm

— Google DeepMind (@GoogleDeepMind) March 12, 2025