La inteligencia artificial de Google es capaz de procesar varios libros en un mismo mensaje: ¿qué hará con todos esos datos?

Alistair Barr
| Traducido por: 
Una niña intenta coger un libro de una estantería.
Una niña intenta coger un libro de una estantería.Hasret Sonmez/Getty Images
  • Google Gemini 1.5 Pro tiene una ventana contextual de 1 millón de tokens.
  • Los usuarios tendrán la posibilidad de enviar mensajes gigantescos equivalentes a varios libros. 
  • ¿Qué hará Google con todos los datos que los usuarios compartan con la empresa?
Análisis Faldón

Hace dos décadas, el cofundador de Google, Larry Page, soñaba con escanear digitalmente millones de libros. Se convirtió en una larga y amarga batalla legal que la empresa acabó ganando.

Hoy, la aparición de enormes modelos de IA está dando la vuelta a este debate sobre el escaneado de libros.

Google lanzará en breve un nuevo y potente modelo llamado Gemini 1.5 Pro que tiene una ventana contextual de 1 millón de tokens. Es decir, unas 750.000 palabras, o el equivalente a entre 3 y 7 libros, dependiendo de su longitud. También puede absorber 1 hora de vídeo, 11 horas de audio y más de 30.000 líneas de código a través de indicaciones al usuario.

"Capacidades totalmente nuevas"

Hasta hace poco, los modelos de IA sólo podían manejar unos pocos miles de tokens. Esto significaba que los usuarios estaban limitados en sus interacciones con estos sistemas. Era un poco como mantener una conversación con un amigo olvidadizo que tenía que reiniciar la charla cada poco tiempo desde cero.

Gemini 1.5 Pro está siendo probada por unos pocos afortunados. Cuando se despliegue por completo, los usuarios podrán volcar series enteras de libros, bases de código, historiales jurídicos completos o cualquier cosa que deseen. Este modelo de Google puede ingerir toda esta información rápidamente y responder a preguntas sobre los datos.

"Las ventanas de contexto más largas nos muestran la promesa de lo que es posible", afirmó Sundar Pichai, CEO de Google, al presentar Gemini 1.5 en febrero. "Permitirán capacidades completamente nuevas".

Un vacío digital gigante

¿Qué va a hacer Google con los datos que la gente comparta a través de Gemini 1.5?

Después de esforzarse tanto durante tantos años para escanear millones de libros por sí mismo, Google ahora tendrá usuarios volcando voluntariamente volúmenes enteros en su modelo de IA, junto con montañas de otros textos, códigos, imágenes y videos.

Es muy probable que esta información se utilice como datos de entrenamiento para ayudar a Google a crear otros modelos. La aparición de la IA generativa ha desencadenado una carrera mundial en busca de datos de alta calidad, por lo que una enorme ventana contextual puede funcionar como un gigantesco vacío digital.

Google afirma que los datos compartidos con Gemini "ayudan a mejorar y desarrollar los productos, servicios y tecnologías de aprendizaje automático de Google."

El aprendizaje automático es un tipo de IA. Por tanto, resulta bastante probable interpretar este comentario como un sí: Google utilizará estos datos para entrenar futuros modelos de IA.

Desarrolladores frente a clientes corporativos

El gigante de internet trata la información compartida con sus modelos y servicios de IA de forma diferente, dependiendo de la oferta.

Google AI Studio es una nueva herramienta para desarrolladores de Gemini. Para este servicio, la compañía dice que el contenido enviado "puede ser utilizado para mejorar nuestros servicios, incluyendo nuestras tecnologías de aprendizaje automático".

Vertex AI es una plataforma empresarial para grandes clientes corporativos. Google ha declarado a BI que, en este caso, la empresa "no utiliza datos de clientes para entrenar modelos de Google sin el permiso de ese cliente".

Gemini 1.5 Pro, el modelo de IA de Google más sofisticado y con la ventana de contexto más grande, aún no está totalmente disponible, por lo que no se han publicado las condiciones del servicio. Un portavoz de Google no ha querido comentar qué enfoque de uso de datos se aplicará a este modelo superior. "Daremos prioridad a la transparencia, la elección y el control", explican desde la compañía.

Lo que necesitas saber para estar informado

Lo que necesitas saber para estar informado

¿Te gusta lo que lees? Comienza tu día sabiendo qué piensan y qué les preocupa a los ejecutivos de las principales empresas del mundo con una selección de historias enviada por Business Insider España a primera hora cada mañana.

Recibe la newsletter

Un nuevo mundo de IA

En cualquier caso, se trata de un nuevo y desafiante mundo de intercambio de información. Probablemente por eso algunas grandes empresas han vuelto a enviar recientemente advertencias prohibiendo a sus empleados compartir datos sensibles con modelos de IA.

Google también avisa a los usuarios sobre la posibilidad de compartir ciertos datos con sus modelos.

"No envíes información sensible, confidencial o personal a los servicios", dice la compañía en negrita en una de sus cláusulas actuales del servicio de Gemini.

Cómo controlar los prompts que ya has enviado

Aquí tienes otros consejos importantes para controlar el uso que Google hace de los mensajes (prompts) que envías a sus modelos de inteligencia artificial. Estos puntos proceden de un portavoz de la empresa y de las condiciones de servicio de Google.

  1. Puedes desactivar la Actividad de Gemini Apps a través de este panel. Esto evita que tus conversaciones futuras se utilicen para mejorar los modelos de IA generativa de Google.
  2. Si esta opción está desactivada, tus conversaciones se seguirán guardando durante un máximo de 72 horas para ayudar a Google a proporcionar el servicio Gemini AI y procesar cualquier comentario que quieras compartir con la empresa.
  3. En esas 72 horas, a menos que proporciones tus comentarios, tus conversaciones tampoco se utilizarán para mejorar los productos de Google, incluidos sus modelos de IA.
  4. Si eres mayor de 18 años, Google almacena tu actividad en Gemini Apps en tu cuenta de Google durante un máximo de 18 meses por defecto. Puedes reducir este periodo a 3 o 36 meses en la configuración de la actividad de Gemini Apps
  5. También puedes revisar o eliminar tu actividad en ese mismo panel en cualquier momento.

El 28 de febrero, Axel Springer, la empresa matriz de Business Insider, se unió a otros 31 grupos de medios de comunicación y presentó una demanda de 2.300 millones de dólares contra Google en un tribunal holandés, en la que denunciaba las pérdidas sufridas debido a las prácticas publicitarias de la empresa.

Conoce cómo trabajamos en Business Insider.