Así es el modelo que promete superar a ChatGPT-4: ¿será el primero en lograrlo?

6 mar. 2024 16:45h.

El modelo Claude 3, en su versión superior, promete superar por fin al hasta ahora invencible ChatGPT4.
Se han realizado benchmarkts o comparativas de capacidades, para demostrarlo.

Tras confirmarse que el último gran lanzamiento de inteligencia artificial (IA) de Google, Gemini 1.5 Ultra, tampoco superaba las capacidades de ChatGPT-4, la lucha por ese anhelo continúa y ha salido otro modelo, llamado Claude 3, que promete según las pruebas superarlo. ¿Es realmente así? Los benchmarks o comparativas de rendimiento han hablado y se pueden sacar conclusiones.

La innovación es la constante que mantiene en continua pugna y evolución a la comunidad tecnológica, con el beneficio para el usuario, pero también la sobre información de un sector que cambia casi cada día.

La aparición de GPT-4 por parte de OpenAI marcó un antes y un después en el entendimiento y las capacidades de los modelos de lenguaje generativos. Sin embargo, la carrera por el liderazgo en esta revolucionaria área no se detiene aquí y siempre el reto está en superar al mejor. En este contexto, emerge un nuevo contendiente que promete no solo igualar, sino superar las capacidades de ChatGPT-4: el modelo Claude 3 de Anthropic.

El surgimiento de Claude 3

Anthropic, una firma establecida por exmiembros de OpenAI, ha sido un actor clave en el ámbito de la IA con el desarrollo de su modelo Claude. Recientemente, con el lanzamiento de Claude 3, la compañía ha causado un revuelo significativo en la industria, afirmando superar a GPT-4 en diversos benchmarks. Este modelo viene en tres versiones: Opus, Sonnet y Haiku, cada una diseñada para satisfacer diferentes niveles de demanda y complejidad.

Benchmarks y capacidades

Comparativa entre las versiones de Claude 3 y ChatGPT-4 en los benchmarkts — Anthropic

Los benchmarks disponibles apuntan a que Claude 3 supera a GPT-4 en varios aspectos, sobre todo en su versión más avanzada, Opus, que ha demostrado capacidades de comprensión y procesamiento de información cercanas al humano.

Un aspecto distintivo de Claude 3 es su habilidad en las tareas de visión por computadora, superando incluso a la versión de GPT-4 especializada en visión, lo cual amplía significativamente sus aplicaciones potenciales.

Datos demostrativos

Por ejemplo, Claude 3 en su versión superior de Opus supera a ChatGPT-4 en razonamiento experto a nivel de posgrado (GPQA) en un 14,7 por ciento (50,4 frente a 35,7); lo mismo sucede con matemáticas básicas con un 95 por ciento de Opus, frente a un 92 por ciento de GPT-4, y con el conocimiento MMLU (86,8 y 86,4 por ciento, respectivamente).

Claude 3: innovación en contexto y precisión

Una de las fortalezas de Claude 3 reside en su manejo del contexto. Con una ventana de contexto de 200.000 tokens (frente a los 128.000 de ChatGPT-4 Turbo), igual a su predecesor Claude 2.1, este modelo es capaz de analizar y procesar información equivalente a un documento de casi 470 páginas. Lo que distingue a esta versión es el uso optimizado de dicha ventana, resultando en una precisión mejorada en sus respuestas y análisis.

Disponibilidad y aplicaciones

Según Anthropic, tanto Sonnet como Opus ya están accesibles a través de la plataforma Claude.ai y su API, llegando a 159 países, incluido España. Esto representa una oportunidad sin precedentes para desarrolladores y empresas de experimentar con este modelo avanzado, potencialmente catalizando innovaciones en sectores como la tecnología, la medicina y la educación.

El modelo Sonnet está disponible gratuitamente en la web y Opus para los suscriptores de Claude Pro. Además, Sonnet también se puede encontrar en Amazon Bedrock y en vista previa privada en Vertex AI Model Garden de Google Cloud. El modelo que no está aún disponible es Haiku, pero la compañía ha anunciado que lo estará pronto.

¿El fin de la hegemonía de ChatGPT-4?

La pregunta que resuena en la comunidad tecnológica es si Claude 3 representa el fin de la hegemonía de GPT-4. Aunque es innegable que GPT-4 y su versión Turbo han establecido un alto estándar, la aparición de Claude 3 sugiere que el panorama de la IA está lejos de ser estático. La competencia estimula la innovación, y en este caso, podría acelerar el desarrollo de modelos aún más avanzados y especializados.

Sin embargo, hasta ahora varios habían asegurado que su modelo superaba en rendimiento a ChatGPT-4 pero eran bajo condiciones específicas y tras un entrenamiento o preparación previa.

El modelo Claude 3 de Anthropic se perfila como un serio competidor en el campo de la inteligencia artificial generativa. Con capacidades que prometen superar a las de GPT-4, particularmente en comprensión de texto y visión por computadora, este modelo no solo desafía el estatus quo, sino que también plantea emocionantes posibilidades para el futuro de la IA.

Otro punto a favor de Anthropic, como apunta Enric Reverter en este vídeo del canal de IA donde colabora, experto en Data Science y LLMs, es que es "la única empresa que ha presentado un paper en que se han molestado en intentar entender qué partes de la red neuronal se utilizan cuando un modelo LLM alucina, o sea, son los únicos que están intentando entender ciertas cosas de cómo funciona la caja negra de los LLMs".

De todas formas, Reverter apunta también que, comparando métricas, no se puede hablar de la superación de un modelo a otro, y habría que probar otras facetas más allá de las del benchmarkt para llegar a conclusiones claras.

Conoce cómo trabajamos en BusinessInsider.

Etiquetas: Inteligencia artificial Cambio climático, ChatGPT, Internet, Tecnología