Tecnología

¿Quién alucina más Chat GPT-5.1 o Gemini 3?

Ambos sistemas de Inteligencia Artificial Generativa tuvieron avances con respecto a sus versiones anteriores, pero padecen el mismo problema: fingen saber.

sáb 29 noviembre 2025 10:00 AM

Chat GPT-5.1 vs. Gemini 3: ¿qué IA alucina más y quién hace las mejores imágenes? — Ambas herramientas padecen de problemas similares. (Foto: Kenneth Cheung/Getty Images)

Eréndira Reyes

@eresinaeresina

Los sistemas de Inteligencia Artificial (IA) generativa han avanzado de manera rápida en los últimos dos años, pero aún no logran tener un trabajo íntegro y sin errores. GPT-5.1 y Gemini 3 son los dos modelos que hoy definen la frontera del lenguaje generativo, presumen mejoras en razonamiento, multimodalidad y capacidad para sostener conversaciones prolongadas. Pero ambos modelos alucinan.

Aunque la respuesta en preguntas básicas es más rápida en el caso de GPT-5.1, Gemini destacó en el desarrollo de imágenes y de acuerdo con análisis como el hecho por Decoder , que evalúa distintos chatbots en la industria, se debe a que el entrenamiento del producto de Google prefiere admitir lagunas de información, antes de fabricar hechos.

Gemini 3: brillante y multimodal

Gemini 3 nació con una ambición distinta al lenguaje desarrollado por OpenAI, al afinar sus capacidades lingüísticas y concentró su ingeniería en la multimodalidad. El resultado es un modelo que ve, escucha y analiza imágenes con una fluidez notable en comparación con GPT-5.1, el modelo identifica de manera más optimizada las descripciones que realiza un usuario en la plataforma, pero también es capaz de proponer mejoras en imágenes gráficas a partir de datos.

En un ejercicio realizado por Expansión se le solicitó a modelos de IA generar una infografía a partir de un informe financiero de una compañía. En el gráfico se pidió destacar las verticales de negocio más relevantes de una empresa, así como un texto que explicara la situación de la firma a partir de un lenguaje accesible para el público en general.

Gemini generó una propuesta informativa clara y acompañada de imágenes, mientras que OpenAI estructuró gráficas especializadas en economía, un resultado alejado a lo que se le solicitó.

Para el texto, el comportamiento de Gemini es más sobrio, pero sigue siendo menos consistente que GPT-5.1 cuando la tarea exige cadenas lógicas largas o precisión factual fina.

Mientras las versiones pasadas de GPT ya mostraban una clara ventaja en español, GPT-5.1 amplía esa distancia. En pruebas comparativas, el modelo de OpenAI produce respuestas más naturales, con menos interferencias del inglés y mayor dominio de estructuras idiomáticas complejas.

Gemini 3, pese a mejorar significativamente, mantiene anglicismos sintácticos y errores gramaticales, pero si se desarrollan los prompts en inglés la experiencia de usuario resulta más eficiente respecto a las versiones pasadas.

El espejismo de la actualización constante

Tanto GPT-5.1 como Gemini 3 presumen acceso a información en tiempo real mediante herramientas de búsqueda, pero ambos sufren a la hora de buscar información actualizada y a no saber con precisión responder sobre un evento.

GPT-5.1, por ejemplo, entrelazar fuentes con argumentos de forma más coherente, mientras que Gemini 3 integra la información con una frialdad casi mecánica, esto sin que el usuario tenga que decirle la forma en que debe responder.

A pesar de las diferencias de los modelos de IA, ambos comparten una fragilidad fundamental: responden con autoridad incluso cuando no tienen razón. Al ser cuestionados con datos, ambos chatbots dudan en sus respuestas y es en ese punto cuando evidencian que su respuesta fue generada a partir de un contexto que fabricaron. La batalla por la corroboración de la información en esta nueva era de máquinas parlantes, la inteligencia humana es necesaria.