Tecnología

OpenAI lanza una nueva serie de modelos de IA con capacidad de "razonamiento"

El modelo conocido internamente como strawberry tuvo altas calificaciones en pruebas de matemáticas y codificación. Pero la empresa reconoce que aún puede dar respuestas limitadas.

jue 12 septiembre 2024 03:53 PM

Añadir Expansión en Google

open ai o1 coding.png — Para las tareas de razonamiento complejas, esto es un avance significativo y representa un nuevo nivel de capacidad de IA, explicó OpenAI en la presentación del nuevo modelo. (OpenAI (captura de video))

Expansión Digital

OpenAI, respaldada por Microsoft, anunció el jueves el lanzamiento de su serie Strawberry de modelos de inteligencia artificial diseñados para dedicar más tiempo a procesar respuestas a consultas, con el fin de resolver problemas difíciles.

Los modelos, de los que Reuters informó por primera vez, son capaces de razonar a través de tareas complejas y pueden resolver problemas más complejos que los modelos anteriores en ciencia, codificación y matemáticas, dijo la empresa de IA en una entrada de blog.

OpenAI utiliza el nombre en clave Strawberry para referirse internamente al proyecto, mientras que a los modelos anunciados el jueves los denomina o1 y o1-mini. El o1 estará disponible en ChatGPT y su API a partir del jueves, según la empresa.

Noam Brown, investigador de OpenAI centrado en mejorar el razonamiento en los prototipos de la compañía, confirmó en un post en la plataforma de redes sociales X que los modelos eran los mismos que los del proyecto Strawberry.

"Me emociona compartir con todos vosotros el fruto de nuestro esfuerzo en OpenAI por crear modelos de IA capaces de un razonamiento verdaderamente general", escribió Brown.

Lee:

Tecnología

OpenAI apoya que el contenido sintético lleve "marca de agua"

En la entrada de su blog, OpenAI afirma que el modelo o1 obtuvo una puntuación del 83% en el examen clasificatorio de la Olimpiada Internacional de Matemáticas, frente al 13% de su modelo anterior, GPT-4o.

El modelo también mejoró su rendimiento en preguntas de programación competitivas y superó el nivel de precisión de un doctorado humano en una serie de problemas científicos, según la empresa.

¿Para qué puede usarse?

De acuerdo con Brown, los modelos lograron estas puntuaciones gracias a la incorporación de una técnica de razonamiento conocida como "cadena de pensamiento", que consiste en dividir los problemas complejos en pasos lógicos más pequeños.

El modelo "o1 puede ser utilizado por investigadores del sector sanitario para anotar datos de secuenciación celular, por físicos para generar fórmulas matemáticas complicadas necesarias para la óptica cuántica y por desarrolladores de todos los campos para crear y ejecutar flujos de trabajo de varios pasos", explicó la empresa.

Los investigadores han observado que el rendimiento de los modelos de IA en problemas complejos tiende a mejorar cuando este enfoque se utiliza como técnica de estimulación. OpenAI ha automatizado esta capacidad para que los modelos puedan descomponer los problemas por sí solos, sin que el usuario tenga que darles instrucciones.

"Hemos entrenado a estos modelos para que dediquen más tiempo a pensar en los problemas antes de responder, como haría una persona. A través del entrenamiento, aprenden a refinar su proceso de pensamiento, probar diferentes estrategias y reconocer sus errores", señala OpenAI.

En su blog, OpenAI afirmó que está planeando brindar acceso a o1-mini a todos los usuarios de ChatGPT Free .

Con información de Reuters

OpenAI lanza una nueva serie de modelos de IA con capacidad de "razonamiento"

Lee:

OpenAI apoya que el contenido sintético lleve "marca de agua"

¿Para qué puede usarse?

Tags

Más acerca del autor:

Newsletter