Publicidad
Publicidad

OpenAI lanza una nueva serie de modelos de IA con capacidad de "razonamiento"

El modelo conocido internamente como strawberry tuvo altas calificaciones en pruebas de matemáticas y codificación. Pero la empresa reconoce que aún puede dar respuestas limitadas.
jue 12 septiembre 2024 03:53 PM
open ai o1 coding.png
Para las tareas de razonamiento complejas, esto es un avance significativo y representa un nuevo nivel de capacidad de IA, explicó OpenAI en la presentación del nuevo modelo.

OpenAI, respaldada por Microsoft, anunció el jueves el lanzamiento de su serie Strawberry de modelos de inteligencia artificial diseñados para dedicar más tiempo a procesar respuestas a consultas, con el fin de resolver problemas difíciles.

Publicidad

Los modelos, de los que Reuters informó por primera vez, son capaces de razonar a través de tareas complejas y pueden resolver problemas más complejos que los modelos anteriores en ciencia, codificación y matemáticas, dijo la empresa de IA en una entrada de blog.

OpenAI utiliza el nombre en clave Strawberry para referirse internamente al proyecto, mientras que a los modelos anunciados el jueves los denomina o1 y o1-mini. El o1 estará disponible en ChatGPT y su API a partir del jueves, según la empresa.

Noam Brown, investigador de OpenAI centrado en mejorar el razonamiento en los prototipos de la compañía, confirmó en un post en la plataforma de redes sociales X que los modelos eran los mismos que los del proyecto Strawberry.

"Me emociona compartir con todos vosotros el fruto de nuestro esfuerzo en OpenAI por crear modelos de IA capaces de un razonamiento verdaderamente general", escribió Brown.

En la entrada de su blog, OpenAI afirma que el modelo o1 obtuvo una puntuación del 83% en el examen clasificatorio de la Olimpiada Internacional de Matemáticas, frente al 13% de su modelo anterior, GPT-4o.

El modelo también mejoró su rendimiento en preguntas de programación competitivas y superó el nivel de precisión de un doctorado humano en una serie de problemas científicos, según la empresa.

¿Para qué puede usarse?

De acuerdo con Brown, los modelos lograron estas puntuaciones gracias a la incorporación de una técnica de razonamiento conocida como "cadena de pensamiento", que consiste en dividir los problemas complejos en pasos lógicos más pequeños.

El modelo "o1 puede ser utilizado por investigadores del sector sanitario para anotar datos de secuenciación celular, por físicos para generar fórmulas matemáticas complicadas necesarias para la óptica cuántica y por desarrolladores de todos los campos para crear y ejecutar flujos de trabajo de varios pasos", explicó la empresa.

Los investigadores han observado que el rendimiento de los modelos de IA en problemas complejos tiende a mejorar cuando este enfoque se utiliza como técnica de estimulación. OpenAI ha automatizado esta capacidad para que los modelos puedan descomponer los problemas por sí solos, sin que el usuario tenga que darles instrucciones.

"Hemos entrenado a estos modelos para que dediquen más tiempo a pensar en los problemas antes de responder, como haría una persona. A través del entrenamiento, aprenden a refinar su proceso de pensamiento, probar diferentes estrategias y reconocer sus errores", señala OpenAI.

En su blog, OpenAI afirmó que está planeando brindar acceso a o1-mini a todos los usuarios de ChatGPT Free .

Con información de Reuters

Publicidad

Tags

Newsletter

Únete a nuestra comunidad. Te mandaremos una selección de nuestras historias.

Publicidad

Publicidad