Meta usó libros protegidos por derechos de autor para entrenar su modelo de IA en contra de las advertencias de sus propios abogados

Mark Zuckerberg, CEO y cofundador de Meta.
Mark Zuckerberg, CEO y cofundador de Meta.

Reuters

  • A pesar de las advertencias de que la inteligencia artificial podría reemplazar millones de puestos de trabajo en un futuro, existen colectivos, como el de los artistas, que ya se han visto afectados por la llegada de esta tecnología. 
  • Los grandes modelos lingüísticos que se esconden detrás de las herramientas de IA han sido entrenados con libros protegidos por derechos de autor. Al menos eso es lo que denuncia un colectivo de importantes autores que cuenta con pruebas sólidas.

Hace ya bastantes meses, cuando acababan de salir al mercado las herramientas de inteligencia artificial que ahora están en boca de todo el mundo (como ChatGPT), hubo algunos expertos que anticiparon que esta tecnología iba a generar una automatización de puestos de trabajo sin precedentes

Aunque ha habido otros expertos que ya han salido a desmentir esas afirmaciones, la realidad es que —quizá más pronto que tarde— parece que la IA generativa va a tener un impacto en el día a día de cientos de millones de personas

Algunas personas, de hecho, ya están notando ese impacto en su forma de ganarse la vida. Es el caso de los artistas, un colectivo que hace ya más de un año contaba cuáles eran sus sensaciones frente a esta tecnología en entrevista para Business Insider España

 "Son lavadoras de propiedad intelectual y derechos morales, atacan al autor, y esto puede ser un gran enemigo del emprendimiento a largo plazo", denunciaba Jon Juarez, un artista conceptual que ha trabajado para compañías de la talla de HBO, Netflix, Square Enix o Microsoft.

ChatGPT puede quitarte el trabajo, como le ha pasado a este señor.

En ese caso en particular, Juarez se refería a los generadores de imágenes por inteligencia artificial, pero los artistas también han cargado contra los generadores de texto por IA. A mediados de 2023, Dan Brown, Margaret Atwood y más de 8.000 autores exigieron a través de una carta abierta dirigida a las empresas de inteligencia artificial que se dejasen de plagiar sus libros.

Algunos escritores, como George R. R. Martin, han llegado a demandar a OpenAI —la desarrolladora de ChatGPT— por infringir sus derechos de autor y esta semana se ha conocido otra denuncia similar dirigida a Meta, la matriz de Facebook, Instagram y WhatsApp. 

Tal y como ha informado Reuters, se trata de una demanda que viene a consolidar dos denuncias interpuestas inicialmente este verano contra la matriz de Facebook por parte de la humorista Sarah Silverman, el ganador del Premio Pulitzer Michael Chabon y otros autores destacados.

 

Estos escritores alegan que Meta ha utilizado sus obras sin permiso para entrenar su gran modelo lingüístico, Llama. Según la agencia de noticias británica, la demanda sostiene que los abogados de Meta habían advertido a la compañía sobre los riesgos legales de utilizar miles de libros pirateados para entrenar sus modelos de IA, pero la empresa hizo caso omiso de estas recomendaciones.

La denuncia, que ha sido presentada después de que se desestimase parte de la acusación presentada en un primer momento, incluye mensajes de un investigador de Meta en los que se discute la obtención del conjunto de datos, una prueba que serviría para demostrar que la compañía era consciente de que su uso de los libros podría no estar protegido por la ley de derechos de autor de Estados Unidos.

La noticia de Reuters recoge que, en los mensajes citados en la demanda, el investigador Tim Dettmers describe sus idas y venidas con el departamento jurídico de Meta sobre si el uso de los archivos de libros como datos de entrenamiento sería "legalmente correcto".

"En Facebook, hay mucha gente interesada en trabajar con (T)he (P)ile, incluido yo mismo, pero en su forma actual, no podemos usarlo por razones legales", escribió Dettmers en 2021, refiriéndose a un conjunto de datos que la matriz de Facebook ha reconocido haber utilizado para entrenar su primera versión de Llama, según la denuncia.

Descubre más sobre , autor/a de este artículo.

Conoce cómo trabajamos en Business Insider.