El anuncio de Zuck sobre la IA es fantástico, pero aún no se ha puesto a la altura de Sam Altman

Hasan Chowdhury,

20 abr. 2024 5:15h.

Mark Zuckerberg acaba de presentar los nuevos modelos de IA de Meta.
Llama 3, revelado el jueves, supera a varios de sus modelos competidores.
Pero lo que Llama 3 no hace es superar a GPT-4 de OpenAI.

Mark Zuckerberg acaba de presentar los nuevos modelos de inteligencia artificial de Meta, y están ofreciendo a la gente muchas razones para entusiasmarse.

Llama 3, presentado el pasado jueves, supone el último esfuerzo del jefe de Meta por enfrentarse a sus rivales en la carrera por desarrollar formas más potentes de IA. La empresa califica esta nueva generación de los modelos "más capaces" disponibles hasta la fecha.

A pesar de tener el mismo tamaño que sus predecesores, los modelos Llama 3 "establecen un nuevo estándar a esta escala", afirma Meta. Esto se debe a la mejora de las capacidades en áreas como el razonamiento y la generación de código.

También se han hecho otros ajustes para responder a las quejas de que los modelos de IA de la última generación eran "un poco puritanos", como dijo Nick Clegg, de Meta, en una entrevista con el Financial Times.

Quizá el detalle más importante sea que los modelos de código abierto de Meta pronto estarán a la altura de sus homólogos de código cerrado. Los modelos Llama 3, de mayor tamaño, con 400.000 millones de parámetros y funciones multimodales —que, según Meta, aún están en fase de formación— serán comparables a modelos patentados como Claude 3 Opus de Anthropic y GPT-4 de OpenAI en el momento de su lanzamiento.

Para los desarrolladores de IA de código abierto, será un gran avance. El año pasado, los modelos de IA en los que estaban trabajando parecían bastante rudimentarios, ya que les costaba completar frases sin repetirse.

Como señaló el mes pasado la fundadora de AI, Sharon Zhou, ver una respuesta a una pregunta como "'mi nombre es es es es' no era raro".

Así que sí, Llama 3 es un gran paso adelante para Zuck y para las ambiciones de IA de la comunidad de código abierto en general. Pero también demuestra que el modelo de hace un año de Sam Altman sigue siendo el referente.

Poniéndose al día con GPT-4

Sam Altam, CEO de OpenAI.
REUTERS/Carlos Barria/File Photo

El modelo GPT-4 de OpenAI, presentado en marzo de 2023, ha sido el modelo a batir durante el último año, y todo el mundo, desde gigantes de la industria como Google hasta startups de moda como Anthropic y Mistral, ha intentado emular su rendimiento.

Gemini, de Google, lanzado en febrero, superó por muy poco a GPT-4 en algunas pruebas de rendimiento. Los modelos Claude de Anthropic, lanzados el mes pasado, también demostraron mejoras marginales respecto al modelo de OpenAI.

Pero en lugar de superar a GPT-4, los próximos modelos de Llama 3 se unirán a una serie de competidores que se sitúan al mismo nivel que el producto que OpenAI lanzó hace un año.

Eso no significa que haya que despreciar los avances que representa Llama 3.

Jim Fan, director de investigación de Nvidia, escribió en X que espera que los modelos de mayor tamaño de Llama 3 marquen el "momento decisivo en el que la comunidad obtenga acceso abierto a un modelo de clase GPT-4", un momento que "cambiará el cálculo" para investigadores y startups.

Pero está claro que aún no ha llegado nada que supere con holgura el rendimiento de lo que Altman ya ha presentado.

Zuckerberg no parece demasiado preocupado por intentar superar a GPT-4, por el momento. Ha dicho a The Verge que el objetivo con Llama 3 "no era construir algo que estuviera muy por delante". Su objetivo era llevar la IA con las capacidades de los mejores modelos actuales a plataformas como Facebook e Instagram.

Lo que necesitas saber para estar informado

¿Te gusta lo que lees? Comienza tu día sabiendo qué piensan y qué les preocupa a los ejecutivos de las principales empresas del mundo con una selección de historias enviada por Business Insider España a primera hora cada mañana.

Recibe la newsletter

Sin embargo, en enero insinuó que su ambición principal era superar a GPT-4, tras publicar un breve vídeo en el que afirmaba que la "visión a largo plazo de Meta es construir inteligencia general, hacer código abierto de forma responsable y ponerla a disposición de todo el mundo para que todos puedan beneficiarse".

Queda por ver cuándo y cómo una empresa que compite por la supremacía de la IA da el siguiente salto en rendimiento.

Algunos miembros del sector, como el profesor de la Universidad de Nueva York y experto en IA Gary Marcus, ven indicios de que los modelos están alcanzando "un periodo de rendimientos decrecientes", lo que plantea dudas sobre si se volverá a ver un salto generacional en el rendimiento.

Por ahora, sin embargo, está claro que Zuck y compañía están jugando a ponerse al día con Altman.

Axel Springer, la empresa matriz de Business Insider, ha llegado a un acuerdo global para permitir que OpenAI entrene sus modelos con la información de sus medios de comunicación.

Conoce cómo trabajamos en BusinessInsider.

Poniéndose al día con GPT-4

Lo que necesitas saber para estar informado

Otros artículos interesantes: