El lanzamiento de DeepSeek V4-Pro no provocó un terremoto similar en los mercados, pero eso no significa que sea irrelevante, pues anunció un descuento de 75% para su modelo V4-Pro que extendió hasta el 31 de mayo de este año.
Con ese ajuste, el costo por un millón de tokens de entrada baja de 1.74 dólares a 0.435 dólares, mientras que el millón de tokens de salida pasa de 3.48 dólares a 0.87 dólares.
DeepSeek presentó V4 como una familia de modelos con dos versiones, V4-Pro, su opción más potente, y V4-Flash, una alternativa más ligera y económica. Según la documentación de la empresa, V4-Pro tiene 1.6 billones de parámetros totales y 49,000 millones activos, mientras que V4-Flash tiene 284,000 millones de parámetros totales y 13,000 millones activos. Ambos soportan una ventana de contexto de un millón de tokens.
Una de las mediciones que más llaman la atención es el procesamiento de los tokens que empresas como Gemini, de Google Cloud han tenido. Sundar Pichai, CEO de Alphabet y Google, dijo que sus inversiones en IA ya forman parte de la rentabilidad de su empresa y de otras compañías, y como ejemplo señaló que Gemini ya procesa más de 16,000 millones de tokens por minuto mediante uso directo de API por clientes.
“Nvidia y las otras empresas de semiconductores continúan siendo los principales beneficiados por la inversión en IA, pero actualmente el mercado está mirando también a las compañías que están realizando esta inversión para ver si pueden rentabilizarla, en caso de lograrlo harían sostenible la demanda por chips y por ende toda la cadena de suministro se beneficiaría”, señaló Rolando Rogers, portfolio manager de Fintual.
DeepSeek, por su parte, insiste en que V4 está optimizado para capacidades “agénticas”, es decir, para sistemas que no solo responden preguntas, sino que ejecutan tareas.