Publicidad
Publicidad

OpenAI presenta Sora: una nueva herramienta que transforma textos en videos

Esta nueva tecnología busca ser una opción más de IA generativa que es capaz de crear videos de máximo 60 segundos con solo escribir prompts.
vie 16 febrero 2024 08:00 AM
OpenAI presenta Sora, su herramienta para crear video con solo escribir un prompt

OpenAI introdujo una nueva herramienta: Sora. Este es un modelo como ChatGPT, donde escribes un texto, solo que el resultado es un video. Pero Sora tiene sus limitaciones; no podrás hacer una película entera con ella. Más bien, es capaz de generar videos de hasta un minuto de duración.

Publicidad

Aunque no especificaron la fecha de su lanzamiento, en la publicación oficial mencionaron que en su etapa inicial está disponible para red teamers, quienes podrán evaluar áreas críticas en busca de riesgos o perjuicios. Además, un grupo selecto de artistas visuales, diseñadores y cineastas tendrán acceso para proporcionar retroalimentación sobre cómo mejorar el modelo para profesionales creativos.

De acuerdo con OpenAI, el modelo de Sora puede generar escenas complejas con múltiples personajes, tipos específicos de movimiento y detalles precisos del sujeto y el fondo. Entiende no solo lo que el usuario ha solicitado en el texto, sino también cómo esas cosas existen en el mundo físico.

“Sora tiene un profundo entendimiento del lenguaje, lo que le permite interpretar con precisión las indicaciones y generar personajes convincentes que expresan emociones vibrantes. Además, puede crear múltiples tomas dentro de un solo video generado, manteniendo la coherencia de los personajes y el estilo visual”, escribieron.

Sin embargo, mencionan que el modelo actual tiene algunas limitaciones. Puede tener dificultades para simular con precisión la física de una escena compleja y entender las relaciones causa-efecto específicas.

En cuanto a la seguridad, se están realizando pruebas adversariales con red teamers y se están desarrollando herramientas para detectar contenido engañoso, como un clasificador de detección que puede identificar cuando un video fue generado por Sora.

Además, OpenAI mencionó está colaborando con legisladores, educadores y artistas de todo el mundo para comprender sus preocupaciones y encontrar casos de uso positivos para esta nueva tecnología.

Sin embargo, esta no es la primera herramienta que convierte texto a video.

En noviembre del año pasado , Meta lanzó Emu, Emu Video y Emu Edit; herramientas de generación de imágenes, vídeos y edición que crean contenido a través de IA generativa.

Sin embargo, de acuerdo con MIT Tech Review, los primeros ejemplos de Meta, Google y una startup llamada Runway presentaban errores y una calidad de imagen granulada.

Estas herramientas se lanzan a menos de un año de las Huelgas de Hollywood, donde uno de los principales acuerdos fue la protección frente al uso no autorizado de la IA.tecnologia

Publicidad

Newsletter

Únete a nuestra comunidad. Te mandaremos una selección de nuestras historias.

Publicidad

Publicidad