Meta lanza una función que permite a los usuarios evitar que sus datos entrenen IA generativa

Mark Zuckerberg

Reuters

  • Meta ha actualizado su centro de recursos de ayuda con un formulario que ofrece a los usuarios cierto control sobre qué datos personales se pueden usar para entrenar modelos de IA generativa. 
  • En el formulario, Meta se refiere a la información de terceros como datos "que están disponibles públicamente en Internet o en fuentes autorizadas".

El avance de los chatbots y modelos de IA generativa ha traído consigo una preocupación enorme a nivel de privacidad de datos.

Muchos de estos modelos son entrenados con datos de uso de los usuarios, que normalmente son de carácter personal y, como es lógico, esto no está siendo bien recibido. 

Con motivo de estas críticas, Meta ha puesto en marcha una opción en que permite a los usuarios eliminar algunos datos personales que la empresa puede utilizar en el entrenamiento de modelos de IA generativa. 

Tal y como apuntan desde CNBC, Meta ha actualizado esta semana la sección de recursos del centro de ayuda de Facebook en su sitio web con un formulario que lleva por nombre "Derechos de los sujetos de datos de IA generativa" que permite a los usuarios "enviar solicitudes relacionadas con el uso de su información de terceros para el entrenamiento de modelos de IA generativa". 

Meta ofrece a los usuarios la opción de acceder, modificar o eliminar cualquier dato personal incluido en las diversas fuentes de datos de terceros que la empresa utiliza para entrenar sus grandes modelos lingüísticos y de IA relacionados.

En el formulario, Meta se refiere a la información de terceros como datos "que están disponibles públicamente en Internet o en fuentes autorizadas". 

Este tipo de información, dice la empresa, puede representar algunos de los "miles de millones de datos" utilizados para entrenar modelos generativos de IA que "utilizan predicciones y patrones para crear nuevos contenidos."

En una entrada de blog relacionada sobre cómo utiliza los datos para la IA generativa, Meta afirma que recopila información pública en la web, además de datos de licencias de otros proveedores. Las entradas de blog, por ejemplo, pueden incluir información personal, como el nombre y los datos de contacto de una persona, explica Meta.

Hay que tener en cuenta que este formulario no tiene en cuenta la actividad del usuario en las propiedades de Meta, ya sean comentarios de Facebook o fotos de Instagram, por lo que es posible que la empresa pueda usar esos datos de primera mano para entrenar sus modelos

Un portavoz de Meta ha comentado que el nuevo modelo de lenguaje de código abierto Llama 2 de la compañía "no fue entrenado con datos de usuarios de Meta, y aún no hemos lanzado ninguna función de consumo de IA Generativa en nuestros sistemas."

"Dependiendo de dónde vivan las personas, pueden ejercer sus derechos como sujetos de datos y oponerse a que ciertos datos se utilicen para entrenar nuestros modelos de IA", añade.

Al igual que muchas empresas tecnológicas, como Microsoft, OpenAI y Alphabet, matriz de Google, Meta recopila enormes cantidades de datos de terceros para entrenar sus modelos y el software de IA relacionado.

"Para entrenar modelos eficaces que desbloqueen estos avances, se necesita una cantidad significativa de información procedente de fuentes disponibles públicamente y con licencia", señala Meta en la entrada del blog. 

La empresa explica que "el uso de información pública y de datos con licencia redunda en nuestro interés, y nos comprometemos a ser transparentes sobre las bases legales que utilizamos para procesar esta información".

La semana pasada, un consorcio de agencias de protección de datos del Reino Unido, Canadá, Suiza y otros países emitió una declaración conjunta dirigida a Meta, Alphabet, ByteDance, matriz de TikTok, X, Microsoft y otras empresas sobre el raspado de datos y la protección de la privacidad de los usuarios.

La carta pretendía recordar a las redes sociales y a las empresas tecnológicas que siguen estando sujetas a diversas leyes de protección de datos y privacidad en todo el mundo y "que protejan la información personal accesible en sus sitios web contra el raspado de datos, sobre todo para que cumplan las leyes de protección de datos y privacidad de todo el mundo".

"Las personas también pueden tomar medidas para proteger su información personal frente al "data scraping", y las empresas de medios sociales tienen un papel que desempeñar para que los usuarios puedan utilizar sus servicios de forma que se proteja su privacidad", afirma el grupo en su comunicado.

Descubre más sobre , autor/a de este artículo.

Conoce cómo trabajamos en Business Insider.