OpenAI, demandada por robar "ingentes cantidades" de datos: la creadora de ChatGPT habría extraído 300.000 millones de palabras de internet

Sam Altman, CEO y fundador de OpenAI.
Sam Altman, CEO y fundador de OpenAI.

Reuters

  • Una de las mayores incógnitas con respecto a la IA generativa siempre ha sido de dónde han sacado las compañías toda la información para nutrir a herramientas como ChatGPT, Bard o Midjourney.
  • Un colectivo de personas ha presentado una denuncia en la que acusa a la desarrolladora de ChatGPT, OpenAI, de haber robado "ingentes cantidades" de información personal para entrenar a sus modelos de IA.

Cuando ChatGPT vio la luz a finales del pasado mes de noviembre, una de las cosas que más llamaban la atención era la inmensa —y variada— cantidad de cosas que era capaz de hacer. Surgía entonces una pregunta: ¿de dónde había sacado toda esa información el generador de texto por inteligencia artificial?

Desde entonces, varios expertos han denunciado que las empresas como OpenAI, la desarrolladora de ChatGPT, estaban extrayendo esos datos de internet, sin pararse a pensar en cuestiones como los derechos de autor

Estas actuaciones han sido denunciadas por analistas como Marc Almeida, programador y experto en ciberseguridad, que señalaba a Business Insider que estas compañías: "Han escaneado Internet, se han nutrido de la información volcada por todos", abanderando así "un paradigma de acción yanqui": "Move fast and break things, que la traducción al castellano sería: más vale pedir perdón que permiso".

La situación llega hasta el punto de que algunas desarrolladoras de inteligencia artificial, como Google, han sido acusadas de entrenar a sus modelos de IA con los datos de otras herramientas que utilizan esa tecnología, como ChatGPT

Sam Altman, CEO y fundador de OpenAI.

Un grupo de personas anónimas ha decidido asociarse y presentar una demanda colectiva contra OpenAI para denunciar precisamente el robo de "ingentes cantidades" de datos, según publica Bloomberg. La denuncia sostiene que la empresa tecnológica habría entrenado sus modelos de inteligencia artificial con esa información en una "despreocupada búsqueda de beneficios".

De ese modo, la desarrolladora de ChatGPT habría violado las leyes de privacidad estadounidenses al extraer en secreto 300.000 millones de palabras de internet, interceptando "libros, artículos, páginas web y mensajes, incluida información personal obtenida sin consentimiento", según recoge la extensa demanda (de 157 páginas). 

Los denunciantes, que según Bloomberg han permanecido en el anonimato por temor a represalias, reclaman una indemnización de 3.000 millones de dólares —unos 2.700 millones de euros— por daños y perjuicios a una cantidad de personas que ellos estiman en millones.

"A pesar de los protocolos establecidos para la compra y uso de información personal, los demandados adoptaron un enfoque diferente: el robo", concluye la denuncia.

Descubre más sobre , autor/a de este artículo.

Conoce cómo trabajamos en Business Insider.