DeepSeek, la IA china frente a ChatGPT, Copilot, Gemini y Llama
De acuerdo con Reuters, a una semana del lanzamiento de DeepSeek, la IA gratuita ya había superado por número a ChatGPT en la tienda de aplicaciones de Apple. Ante ello, expertos en inteligencia artificial y su ingeniería han evaluado su capacidad respecto con la competencia.
Estos son algunos de los resultados:
Gradient Flow
De acuerdo con su análisis , “DeepSeek-V2 tiene un total de 236 mil millones de parámetros, pero solo activa 21 mil millones de parámetros para cada token. Esto permite un cálculo más eficiente y al mismo tiempo mantiene un alto rendimiento, demostrado a través de resultados de primer nivel en varios puntos de referencia.”
Características principales:
Rendimiento mejorado: DeepSeek-V2 es más rápido y consume menos recursos computacionales, lo que lo hace más eficiente. Comprime la caché clave-valor (KV), lo que reduce significativamente el tamaño.
Precisión: Entiende mejor el contexto y genera respuestas más coherentes y útiles. Por su Mixture-of-Expert (MoE) Architecture, logra una alta especialización de expertos y reduce la redundancia de conocimientos.
Escalabilidad: Puede adaptarse a tareas más complejas y grandes volúmenes de datos.
Evaluación sólida en varios idiomas, por lo que es versátil en sus capacidades multilingües.
Alineado con las preferencias humanas: “: DeepSeek-V2 está alineado con las preferencias humanas mediante el uso del marco de aprendizaje de refuerzo (RL) en línea, que supera significativamente el enfoque fuera de línea, y el ajuste fino supervisado (SFT), logrando un rendimiento de primer nivel en los puntos de referencia de conversaciones abiertas.”
Gradient Flow es un sitio para científicos de datos que realizan análisis de datos, tecnología, con enfoque en el aprendizaje automático y la IA.
Comparaciones con otras IA:
GPT-4 (OpenAI)
- Rendimiento: DeepSeek-V2 es más eficiente en términos de uso de recursos, lo que lo hace más rápido y menos costoso de operar.
- Precisión: Aunque GPT-4 es muy avanzado, DeepSeek-V2 mejora en la comprensión de contextos específicos y obrece respuestas más coherentes en tareas especializadas.
- Escalabilidad: DeepSeek-V2 está diseñado para escalar mejor en entornos con grandes volúmenes de datos.
BERT (Google)
- Enfoque: DeepSeek-V2 va más allá al combinar comprensión y generación de texto de manera más equilibrada.
- Eficiencia: DeepSeek-V2 es más eficiente en términos de tiempo de procesamiento y uso de memoria, lo que lo hace más adecuado para aplicaciones en tiempo real.
T5 (Google)
- Versatilidad: DeepSeek-V2 mejora en la especialización y precisión en tareas específicas, pese a que T5 T5 es reconocido por su capacidad para manejar múltiples tareas con un solo modelo.
- Rendimiento: DeepSeek-V2 ofrece un mejor equilibrio entre velocidad y precisión, lo que lo hace más práctico para aplicaciones comerciales.
LaMDA (Google)
- Interacción: LaMDA está diseñado para conversaciones más naturales, DeepSeek-V2 ofrece una mejor comprensión del contexto y genera respuestas más detalladas.
- Eficiencia: DeepSeek-V2 es más eficiente en el manejo de sus recursos, lo que permite su implementación en una gama más amplia de dispositivos y plataformas.
Claude (Anthropic)
- Ética y seguridad: Claude se enfoca en la seguridad y ética en las respuestas, pero DeepSeek-V2 combina esta preocupación con un rendimiento superior en términos de velocidad y precisión.
- Aplicaciones prácticas: DeepSeek-V2 es más versátil y puede adaptarse a una variedad más amplia de aplicaciones empresariales.
Artificial Analysis
Artificial Analysis, tras un análisis de los diferentes modelos de IA, realizó una serie de índices y listas en las que compara otras IA respecto a diferentes conceptos como calidad, velocidad, precio, razonamiento y conocimiento, codificación, etc.
Así quedaron posicionados los modelos de DeepSeek:
Calidad del análisis artificial (cuanto más alto, mejor)
o1 (OpenAI) - 90
DeepSeek R1 - 89
o1-mini (OpenAI) - 84
Gemini 2.0 Flash (Google) - 82
Gemini 1.5 Pro (Google - 80
Velocidad - Tokens de salida por segundo (cuanto más alto, mejor)
o1-mini (OpenAI) - 207
Gemini 2.0 Flash (exp) (Google) - 169
GPT-4o (OpenAI) - 113
Nova Pro (AWS) - 87
DeepSeek R1 - 30
Precio - dólar por 1 millón de tokens (mientras más bajo, mejor)
GPT-4o (OpenAI) - 0.3
Llama 3.3 70B - 0.6
Llama 3.1 70B - 0.7
Nova Pro (AWS) - 1.6
DeepSeek R1 - 2
Puedes consultar los índices completos aquí . Artificial Analysis es un sitio que proporciona puntos de referencia e investigación sobre IA para ayudar a desarrolladores, clientes, investigadores y a usuarios a tomar decisiones.
Censura de información
A pesar de su gran capacidad, un hecho de DeepSeek es que no tiene la capacidad de información que esté fuera de línea con el gobierno chino.
"Hablemos de otra cosa", es la respuesta usual sobre solicitudes de información como asuntos geopolíticos como la situación con Taiwán, la represión en la plaza de Tiananmén de 1989 o el gobierno en la región de Xinjiang,