Publicidad
Publicidad

Youtuber demanda a OpenAI por uso de transcripciones

El usuario David Millette presentó una demanda ante la corte de California, en la que alega que la empresa de IA entrenó a su chatbot sin su consentimiento.
lun 05 agosto 2024 02:30 PM
¿El derecho de autor está en riesgo? Youtuber demanda a OpenAI por uso de sus videos
La demanda fue presentada en el estado de California y busca que la empresa de IA clarifique el uso de este tipo de recursos de 'búsqueda'.

Crear contenido en la era de la Inteligencia Artificial Generativa empieza a traer nuevos casos legales a la mesa. Ahora un youtuber presentó una demanda contra OpenAI, la empresa detrás de ChatGPT, en la que alega que la compañía entrenó sus modelos de IA con millones de transcripciones de videos de YouTube, sin notificar —ni compensar— a los propietarios de los videos.

La denuncia fue presentada ante el Tribunal de Distrito de Estados Unidos para el Distrito Norte de California, donde los abogados de David Millette, un usuario de YouTube con sede en Massachusetts, alegan que la empresa transcribió subrepticiamente los videos de Millette y otros creadores para entrenar a ChatGPT.

Publicidad

El bufete de abogados Bursor & Fisher, que está detrás de esta iniciativa, busca un juicio con jurado y más de 5 millones de dólares en daños para todos los usuarios y creadores de YouTube, cuyos datos podrían haber sido utilizados en el entrenamiento de OpenAI.

Cabe destacar que la mayoría de los modelos de IA usan información pública para dar respuestas a los usuarios, y con cada consulta van a aprendiendo más datos y contexto. Sin embargo, en la demanda se argumentan problemas de derechos de autor.

Las empresas señalan que el uso legítimo protege sus esfuerzos por extraer datos de forma indiscriminada y utilizarlos para entrenar modelos comerciales. Sin embargo, muchos titulares de derechos de autor no están de acuerdo y están presentando demandas destinadas a detener esta práctica.

En abril, The New York Times informó que OpenAI creó su primer modelo de reconocimiento de voz, Whisper, con el fin de transcribir audio de videos para recopilar datos de entrenamiento adicionales.

Esto significó que un equipo de OpenAI transcribió más de un millón de horas de video de YouTube utilizando Whisper, según The Times, y utilizó las transcripciones para entrenar el modelo de generación y análisis de texto de OpenAI, GPT-4.

En una entrevista con Bloomberg, el director ejecutivo de YouTube, Neal Mohan, no confirmó si OpenAI usó videos de YouTube para entrenar su modelo de inteligencia artificial de texto a video, pero dijo que sería una "clara violación" de las políticas de la plataforma si lo hiciera:

“Cuando un creador sube su trabajo a nuestra plataforma, tiene ciertas expectativas. Una de ellas es que se respeten los términos del servicio. No se permite descargar cosas como transcripciones o fragmentos de video”, señaló en un video .

El mes pasado, Mira Murati, directora técnica de OpenAI, dijo que no estaba segura de si Sora había recibido formación en fuentes como YouTube. Google, la empresa matriz de YouTube, también ha buscado utilizar transcripciones para entrenar sus modelos.

El año pasado, Google amplió sus términos de servicio (ToS) en parte para permitir a la empresa utilizar más datos de los usuarios para el entrenamiento de modelos de IA generativos. Bajo los antiguos ToS, no estaba claro si Google podía usar los datos de YouTube para crear productos más allá de la plataforma de video. No es así con los nuevos términos, que relajan considerablemente las riendas.

Ante esto, YouTube tiene en sus términos y condiciones, sobre el uso de IA que "en cuanto a nuestras políticas, estamos obligados a eliminar contenido cuando se nos notifica adecuadamente por parte del titular de los derechos que su obra con derechos de autor ha sido utilizada sin permiso".

Por lo tanto, no es responsabilidad de YouTube o Google determinar quién "posee los derechos" sobre el contenido, y los asuntos que no puedan resolverse a través de su proceso de denuncia, dentro de la plataforma, pueden necesitar ser decididos por los tribunales.

Publicidad

Newsletter

Únete a nuestra comunidad. Te mandaremos una selección de nuestras historias.

Publicidad

Publicidad