YouTube advierte a OpenAI: entrenar a Sora con sus vídeos sería "una clara violación de sus políticas de uso"

Sam Altman, CEO de OpenAI.
Sam Altman, CEO de OpenAI.

Reuters

  • Neal Mohan, CEO de YouTube, ha advertido a OpenAI que extraer vídeos publicados en su plataforma para entrenar modelos de IA como Sora es una "clara violación a sus términos" de uso del servicio.
  • La política de YouTube es tan estricta que ni siquiera Google puede usar los contenidos de la plataforma de vídeos para entrenar a Gemini.

Uno de los proyectos más interesantes de OpenAI, creadores de ChatGPT, de los últimos meses, es Sora

Se trata de una herramienta que Sam Altman y su equipo presentaron el pasado 18 de febrero de este mismo año que destaca por una función muy particular: la posibilidad de crear vídeos realistas con IA basados en las indicaciones de texto los usuarios.

Durante su presentación, OpenAI afirmó que su objetivo con Sora es enseñar a la IA a "entender y simular el mundo físico en movimiento, con el objetivo de entrenar modelos que ayuden a las personas a resolver problemas que requieran interacción en el mundo real".

¿Lo más llamativo? Que los resultados son francamente sorprendentes y a día de hoy es francamente complicado distinguir entre realidad y ficción, algo que deja bien claro el motivo por el que OpenAI recuerda porque la compañía va en cabeza en todo lo relacionado con la IA.

Ahora bien, la manera en la que ha sido entrenada Sora ha puesto en alerta a varias compañías, en donde destaca Google. Para ser exactos, Neal Mohan, CEO de YouTube, ha advertido a OpenAI que extraer vídeos publicados en su plataforma para entrenar modelos de IA como Sora es una "clara violación a sus términos" de uso del servicio. 

Sí que es cierto que Mohan no tiene claro si Sora realmente ha sido entrenado con los vídeos de YouTube, pero deja claro que "las reglas no permiten que se descarguen transcripciones o fragmentos de vídeo".

Es más, la política de YouTube es tan estricta que ni siquiera Google puede usar los contenidos de la plataforma de vídeos para entrenar a Gemini.

Por parte de OpenAI han dejado claro que "es imposible entrenar los principales modelos de IA actuales sin recurrir a materiales protegidos" y que "limitar los datos de entrenamiento a materiales de dominio público creados hace más de un siglo impide a los sistemas de IA satisfacer las necesidades actuales de los usuarios".

Es por este motivo por el que la firma de Sam Altman ha sido muy cuestionada por no revelar las fuentes de donde extraen su información para entrenar a sus modelos y, por eso, muchas organizaciones creen que el hermetismo de OpenAI esconde violaciones a los derechos de autor. 

Ahora bien, parece que incluso dentro de OpenAI no tienen muy claro de dónde extraen la información. Mira Murati, directora de tecnología de la firma de Altman, ha revelado en una entrevista en The Wall Street Journal que no estaba segura si los vídeos de YouTube se han usado para optimizar el funcionamiento de Sora.

Lo que sí que es cierto es que OpenAI ha firmado diversos acuerdos para obtener licencias de uso sobre ciertos contenidos y ahora puede entrenar a los algoritmos de OpenAI con contenidos de medios como El País, Cinco Días, As, El Huffpost, Business Insider o Político

Descubre más sobre , autor/a de este artículo.

Conoce cómo trabajamos en Business Insider.