Google I/O llega cargado de novedades en IA: Gemini más potente, Project Astra y al fin IA generativa en el Buscador

Project Astra

Google

Foto del redactor Roberto CorralesFoto del redactor Roberto Corrales
- Actualizado:
  • Google ha celebrado este martes su evento anual de desarrolladores, I/O, centrado en la inteligencia artificial, en el que ha anunciado la esperada llegada de la IA generativa a su Buscador.
  • En ella ha presentado novedades de Gemini, su IA generativa, que pasa a ser más potente e integrada con Fotos, y también ha anunciado Project Astra para llevar la IA a tareas cotidianas con baja latencia.

Google ha celebrado este martes la cita anual más importante para sus desarrolladores, Google I/O, centrada en sus avances en inteligencia artificial.

Las novedades se han centrado tanto en herramientas ya disponibles como en el anuncio de nuevos proyectos como el asistente Project Astra para la vida cotidiana y con baja latencia o las funciones de IA generativa que ya están presentes en su Buscador.

Sundar Pichai, CEO de Google, ha anunciado las novedades en la era de Gemini, la nueva versión de su IA generativa lanzada en diciembre, que en febrero volvió a actualizarse con Gemini 1.5 Pro, con un millón de tokens para mejorar los resultados.

Ahora, ha anunciado una versión mejorada de Gemini 1.5 Pro que ya está disponible para los desarrolladores de todo el mundo y que expande a 2 millones de tokens su base de datos.

Gemini se ha integrado ahora en Fotos para que los usuarios puedan hacer preguntas a la IA para que se respondan basadas en el archivo de imágenes, o que cree recopilaciones según quiera cada persona, en una función que se lanzará este verano. Si le preguntas tu matrícula, revisará fotos de tu coche que hayas subido hasta recordártela.

Gemini 1.5 Pro

Google

Gemini 1.5 Pro ya está disponible en Worspace Labs, el ecosistema para desarrolladores experimental de la suite de la compañía en la nube.

Las funciones multimodales de Gemini hacen posible que la IA lleva a cabo discusiones, una función que permite conversar con una persona que está estudiando y que explica conceptos de ciencia con ejemplos de baloncesto, por ejemplo.

Los agentes de IA se han utilizado también en los desarrollos de Google en este campo, que en I/O ha mostrado algunos casos de uso como ayudar al usuario a realizar una devolución de un producto accediendo al correo electrónico y a la web para asistir en el reembolso del pedido.

Project Astra, una IA con menos latencia para todas las tareas de la vida cotidiana

Parte de los avances provienen de la unión entre Google y Deepmind, compañía de IA que compró hace años. 

La compañía ha anunciado Gemini 1.5 Flash, una versión con rendimiento más rápido para tareas que requieren baja latencia y una mayor eficiencia que la versión principal. Admite hasta 1 millón de tokens.

Project Astra es un agente de IA universal que pueda ayudar a las personas en aspectos diferentes de la vida cotidiana, capaz de responder a necesidades habituales de las personas y responder con poca latencia. La información se codifica más rápido gracias a codificación de vídeo que se incorpora en la conversación.

Con esta herramienta quiere competir con las novedades anunciadas recientemente pro OpenAI, que anunció ChatGPT 4o hace solo unas horas.

Google ha mostrado un ejemplo de prototipo de la IA de Project Astra, que funciona a través de la cámara del móvil y que es capaz desde reconocer las partes de un altavoz hasta ayudar a resolver ecuaciones o incluso recordar la posición de objetos a través del vídeo.

Está pensado para móviles y otros productos como gafas inteligentes y puede probarse desde este martes en una demo.

Imagen 3 y Veo

Imagen 3

Google

Google ha anunciado su nuevo sistema de generación de imágenes a través de IA, conocido como Imagen 3. Trae avances en texto y en efectos de imagen. Estará disponible para desarrolladores a través de Vertix AI.

Otra novedad es Veo, un sistema de creación de vídeos con Veo, que añade más capacidades de edición y que permite generar imágenes en movimiento con solo comandos de texto.

Google ha anunciado también novedades en semiconductores, como Trillium, su nueva unidad de procesamiento tensorial (TPU) de sexta generación que se lanzará a finales de 2024 para los clientes de Google Cloud.

También ha anunciado novedades en sistemas de refrigeración para centros de datos para la computación en la nube.

Novedades de IA en el Buscador

Google está intentando reaccionar a los avances de OpenAI en búsqueda incorporando novedades de IA en su Buscador derivadas de los avances de Gemini.

Las revisiones de AI Overview, que ya están disponibles en EEUU, se extenderá a 1.000 millones de personas antes de final de año.

Además, el Buscador añade el razonamiento en varios pasos para ayudar en las búsquedas con varios componentes en una sola vez, para destacar varios resultados por ejemplo para crear un plan de comida o de entrenamiento, organizando los resultados en una misma página a través de la IA.

Otra novedad es la posibilidad de buscar en vídeo a través de preguntas en las que el usuario puede no conocer los términos, y en las que el vídeo se codifica en fotogramas para conocer con IA generativa la respuesta a través de una búsqueda en internet.

Gemini se ha extendido también a las videollamadas de Meet, en las que ahora ya permite mostrar transcripción automática a texto en 68 idiomas diferentes de todo el mundo.

La IA de Gemini se ha incorporado también en Gmail para que los usuarios puedan llevar a cabo resúmenes o responder de forma automática con respuestas elaboradas.

Novedades en la app de Gemini

Gems Google

Google

La app de Gemini se ha actualizado también para incluir algunas de las novedades de Project Astra de forma que pueda ayudar a los usuarios en su día a día con la IA.

Gems es una nueva función que permite crear personalidades diferentes con la IA de Google, con conocimientos diferentes y adaptados al uso determinado que quiera la persona. Hace posible por ejemplo pedir que la IA actúen como tu tutor de tesis y te dé recomendaciones académicas.

A partir de este verano, la app añadirá nuevas funciones para ayudar a los usuarios a planear viajes de forma inteligente, dando recomendaciones automáticas según la duración del viaje y cambiando en función de cosas como la hora a la que te despertarás.

Novedades de IA en Android

IA en Android

Google

En lugar de anunciar una nueva versión de Android –algo que finalmente hará mañana con la beta 2 de Android 15–, Google se ha centrado en lanzar funciones relacionadas con la IA en su sistema operativo móvil.

Una de ellas se relaciona con la búsqueda. Después de Rodea para buscar, lo ha actualizado para que ahora no solo busque sino que sea capaz de solucionar problemas matemáticos, que irán volviéndose más complejos a medida que avance el año. Ya está disponible en 100 millones de dispositivos y se espera que alcance 200 millones en 2024.

Gemini hará posible buscar en documentos PDF de varias páginas a través de preguntas a la IA.

Los móviles Pixel se actualizará este año con Gemini Nano, una herramienta que entiende las cosas de forma similar a las personas para mejorar por ejemplo la función de narración para explicar imágenes a personas con problemas de visión.

Otra novedad en la app de Teléfono de Android hace posible que Gemini detecte actividades ilegales y fraudulentas durante llamadas para evitar estafas telefónicas, por ejemplo.

Conoce cómo trabajamos en BusinessInsider.

Etiquetas: Trending, Tecnología, Google