Esta web está vendiendo los mensajes de los usuarios de Discord por 5 euros para entrenar modelos de IA

Ilustración con el logo de Discord.

Reuters

  • Uno de los principales problemas que afronta el auge de la inteligencia artificial generativa es la falta de nueva información con la que poder entrenar los grandes modelos lingüísticos. 
  • Sin embargo, hay quien está encontrando soluciones "alternativas". Spy Pet es una web de dudosa legalidad que recopila datos sobre los usuarios de Discord, incluidos los mensajes que estos publican, y los vende a terceros.

Las grandes tecnológicas se han dado de bruces contra un muro que no habían visto venir. Un muro que puede haber llegado para frenar el avance que ha experimentado en los últimos meses la inteligencia artificial

Se trata de la falta de información. La tecnología que hace funcionar a la IA generativa, los grandes modelos lingüísticos (LLM, por sus siglas en inglés), necesita una inmensa cantidad de datos para ser entrenada. Los LLM necesitan tanta información que es probable que no vaya a haber suficiente con toda la que a día de hoy se encuentra disponible en abierto en internet. 

Esto está llevando a gigantes tecnológicos como Meta, la matriz de Facebook, Instagram y WhatsApp, o a startups pioneras como OpenAI, la desarrolladora de ChatGPT, a tratar de encontrar sus propias soluciones. 

Hace apenas unos días, una información publicada por el New York Times reveló que Meta está tan desesperada por conseguir datos para entrenar sus modelos de inteligencia artificial que se habría planteado comprar una importante editorial estadounidense como Simon & Schuster y podría arriesgarse a ser demandada por derechos de autor. 

En el caso de OpenAI, la startup ha reconocido en alguna ocasión que utiliza un bot araña para rastrear internet y así poder recopilar información para entrenar su modelo de IA. Esta técnica se conoce como "raspado" y se trata de una práctica de dudosa legalidad que ha sido cuestionada por multitud de expertos en ciberseguridad. 

Sería esta técnica la que estarían utilizando desde Spy Pet, una web espía que recopila datos sobre usuarios de Discord, incluidos los mensajes que estos publican en servidores de todo tipo. Así lo ha publicado 404 Media, que ha podido acceder a los servicios que ofrece esta plataforma y ha detallado cómo funciona internamente. 

 

Al parecer, Spy Pet rastrea los servidores de Discord en masa, archivando y rastreando los mensajes de los usuarios y su actividad a través de los servidores (incluyendo los canales de voz a los que se unen), para luego vender el acceso a esa información por tan solo 5 dólares (unos 4,70 euros).

La desarrolladora de este servicio asegura a través de su página web que rastrea más de diez mil servidores de Discord y, además de vender el acceso a cualquier persona que disponga de criptomonedas, también ofrece los datos para el entrenamiento de modelos de inteligencia artificial o para ayudar a las autoridades.

"¿Te has preguntado alguna vez por dónde anda tu amigo en Discord? ¿Cansado de las herramientas de búsqueda básicas como Discord.id? No busques más", se puede leer en la página web de Spy Pet. 

Según 404 Media, este servicio rastrea más de 14.000 servidores, 600 millones de usuarios e incluye una base de datos de más de 3.000 millones de mensajes. El medio de comunicación especializado en tecnología ha señalado que no ha podido comprobar si estas cifras son exactas, pero sí ha confirmado que el servicio extrae mensajes de los servidores de Discord y los pone, junto con otros datos de los usuarios, a disposición de los clientes de pago. 

El servicio requiere un pago mínimo de 5 dólares en criptomonedas —se aceptan Bitcoin, Ethereum o Monero— y, a cambio, los clientes reciben 500 créditos Spy Pet. La búsqueda de un usuario individual parece costar 10 créditos, lo que equivaldría a unos 47 céntimos.

Descubre más sobre , autor/a de este artículo.

Conoce cómo trabajamos en Business Insider.