Entre las funciones que ofrece están producir videos y sonidos personalizados, editar videos existentes o transformar su imágenes en videos.
“Dando un mensaje de texto, podemos aprovechar un modelo conjunto que ha sido optimizado tanto para convención de texto la imagen como de texto a video para crear imágenes y videos de alta calidad y transformación”, señaló la compañía.
Esta tecnología tiene la capacidad de generar videos de hasta 16 segundos, mientras que el audio puede durar hasta 45 segundos.
El anuncio se produce en un momento en el que Hollywood se ha estado debatiendo este año sobre cómo aprovechar la tecnología de video de IA generativa, después de que OpenAI, respaldada por Microsoft, mostró por primera vez en febrero cómo su producto Sora podía crear videos similares a largometrajes en respuesta a mensajes de texto.
Los tecnólogos de la industria del entretenimiento están ansiosos por utilizar este tipo de herramientas para mejorar y agilizar la creación de películas, mientras que a otros les preocupa la adopción de sistemas que parecen haber sido entrenados en obras protegidas por derechos de autor sin permiso.
Meta apuntó que con esta presentación no pretende reemplazar el trabajo de los artistas y animadores, sino que creen “en el poder de esta tecnología para ayudar a las personas a expresarse de nuevas maneras y brindar oportunidades a personas que de otra manera no las tendrían”, dijo.
Los portavoces de Meta dijeron que era improbable que la empresa pusiera Movie Gen a disposición de los desarrolladores, como ha hecho con su serie Llama de modelos de gran tamaño, ya que considera los riesgos individualmente para cada modelo. Se negaron a comentar la evaluación de Meta sobre Movie Gen en concreto.
Movie Gen forma parte de la tercera ola de trabajos conIA que presenta Meta. La primera fue con modelos Make-A-Scence, que permite la creación de imágenes, audio, video y animación 3D.
Le siguió el modeló básico de Llama Image, que permite la generación dei imágenes y videos de mayor calidad, así como edición de imágenes.
“Movie Gen es nuestra tercera ola, que combina todas estas modalidades y permite un control más detallado para las personas que usan los modelos de una manera que nunca antes había sido posible”, agregó Meta.
La forma en la que funciona Movie Gen es que los usuarios entregan un mensaje de texto para la generación del video, por ejemplo “imagina a un hipopótamo bebé nadando”, a partir del resultado que la IA arroje las ediciones también se solicitan con texto, con instrucciones como añadir, eliminar o reemplazar elementos.
De la misma manera es posible solicitar la adición de audio, como sonido ambiental o música instrumental.
Con información de Reuters.