La nueva IA de Apple quiere plantar cara a GPT-4 con su capacidad para entender el contexto

Katherine Tangalakis-Lippert
| Traducido por: 
Un montaje fotográfico que ilustra la apuesta de Apple por la inteligencia artificial.

SOPA Images vía Getty

  • Los investigadores de Apple han desarrollado un nuevo sistema de inteligencia artificial para "ver" e interpretar el contexto de los contenidos que se muestran en la pantalla de un dispositivo.
  • Este sistema, denominado "resolución de referencia como modelado del lenguaje", permite al usuario interactuar de forma más natural con la IA. 

El nuevo desarrollo de Apple en el campo de la inteligencia artificial pretende plantarles cara a los modelos más avanzados de OpenAI, la desarrolladora de ChatGPT, haciendo que las interacciones con asistentes virtuales como Siri sean más intuitivas.

El sistema ReaLM, acrónimo en inglés de "resolución de referencia como modelado del lenguaje", comprende imágenes y contenidos ambiguos que se muestran en la pantalla del dispositivo del usuario, así como el contexto conversacional para permitir interacciones más naturales con la IA.

Al parecer, el nuevo sistema de Apple supera a otros grandes modelos lingüísticos —LLM, por sus siglas en inglés— como el GPT-4, el modelo que impulsa ChatGPT, a la hora de determinar el contexto y a qué se refieren las expresiones lingüísticas, según han defendido los investigadores que lo han desarrollado. 

Además, al ser un sistema menos complejo que otros LLM, como la serie GPT de OpenAI, los investigadores han calificado a ReaLM como la "opción ideal" para un sistema de descifrado de contexto que "puede existir en el dispositivo sin comprometer el rendimiento".

Patente de un Apple Watch con cámara

Por ejemplo, digamos que le pides a Siri que te muestre una lista de farmacias que estén cerca de ti. Al presentarte la lista, podrías pedirle: "Llama a la de la calle Mayor" o "llama a la de abajo". Con ReaLM, en lugar de recibir un mensaje pidiendo más información, Siri podría descifrar el contexto necesario para llevar a cabo esa tarea mejor que GPT-4, según los investigadores de Apple.

"El habla humana suele contener referencias ambiguas como 'esto' o 'eso', cuyo significado es obvio —para otros humanos— dado el contexto", han explicado los investigadores de Apple, refiriéndose a las capacidades de ReaLM. "Ser capaz de entender el contexto, incluidas referencias como éstas, es esencial para un ayudante conversacional que pretende permitir a un usuario comunicar de forma natural sus peticiones a un asistente o a mantener una conversación con él".

El sistema ReaLM puede interpretar imágenes integradas en un texto, algo que, según los investigadores que se han encargado de su desarrollo, puede utilizarse para extraer información como números de teléfono o recetas a partir de las imágenes que se muestren en una página web.

El GPT-3.5 de OpenAI solo acepta entradas de texto y el GPT-4, que también puede interpretar el contexto con imágenes, es un gran sistema entrenado sobre todo con imágenes naturales del mundo real, no con capturas de pantalla, algo que, según los investigadores de Apple, dificulta su rendimiento práctico y convierte a ReaLM en la mejor opción para comprender la información en pantalla.

"Apple ha sido visto durante mucho tiempo como un rezagado de Microsoft, Google y Amazon en el desarrollo de inteligencia artificial conversacional", según han detallado medios como The Information. "El fabricante del iPhone tiene fama de ser un desarrollador cuidadoso y deliberado de nuevos productos, una táctica que le ha funcionado bien para ganarse la confianza de los consumidores pero que puede llegar a perjudicarle en la acelerada carrera de la IA".

Pero, con la revelación de las capacidades de ReaLM, parece que la firma de Cupertino podría estar preparándose para entrar de lleno en la competición.

Los investigadores que están detrás de ReaLM y los representantes de OpenAI no han respondido a las respectivas peticiones de comentarios de Business Insider.

Todavía no está claro si ReaLM se implementará en Siri o en otros productos de Apple, pero el director ejecutivo de la tecnológica, Tim Cook, aseguró durante una reciente llamada con los accionistas de la compañía que está impaciente por compartir detalles de su "trabajo en curso en inteligencia artificial a finales de este año".

Conoce cómo trabajamos en Business Insider.