Anthropic lanza Claude Opus 4 y lo presenta como el mejor modelo de programación del mundo

Los nuevos modelos de IA se centran en programación y razonamiento

Buenos Aires-(Nomyc)-Luego de que Google desplegara toda su artillería en inteligencia artificial, Anthropic no quiere quedarse atrás y la compañía fundada por Dario Amodei presentó Claude Opus 4 y Claude Sonnet 4, dos nuevos modelos con los que aspira a dejar su huella en la carrera por la IA.

La estrella del anuncio es Claude Opus 4, el modelo más avanzado que desarrolló Anthropic hasta ahora del que aseguran que es “el mejor modelo de programación del mundo”, una afirmación ambiciosa que habrá que poner a prueba, aunque los primeros datos lo sitúan muy bien posicionado frente a sus principales rivales.

En el benchmark SWE-bench Verified, que evalúa tareas reales de ingeniería de software, Opus 4 consigue un 72,5 por ciento en condiciones estándar y llega hasta el 79,4 por ciento si se habilita el procesamiento paralelo y es un rendimiento que lo deja por encima de modelos como GPT-4.1, con un 54,6, por ciento; el o3, con un 69,1 por ciento o el reciente Gemini 2.5 Pro de Google, con el 63,2 por ciento.

Mas allá de esto, en otras pruebas más exigentes en razonamiento multimodal, como GPQA Diamond o MMMU, centradas en preguntas de nivel universitario y escenarios complejos que combinan texto e imagen, Opus 4 no consigue superar a o3, que sigue liderando en ese terreno.

Un modelo con resistencia y autonomía: lo que Anthropic quiere destacar es la resistencia y autonomía de este modelo, ya que Claude Opus 4 es capaz de mantener sesiones de trabajo largas y ejecutar miles de pasos de forma continuada.

Desde la empresa explican que esto lo convierte en una base ideal para agentes de IA más sofisticados: sistemas que toman decisiones, completan tareas por su cuenta y no necesitan supervisión humana constante.

De manera paralela llega Claude Sonnet 4, una evolución del modelo que Anthropic lanzó en febrero, que no está pensada para competir con Opus en potencia, pero sí ofrece una propuesta muy equilibrada entre rendimiento y eficiencia.

En codificación también da un salto importante respecto a su versión anterior: pasa del 62,3 al 72,7 por ciento en SWE-bench Verified, y mejora en tareas de razonamiento, seguimiento de instrucciones y precisión general.

Ambos modelos llegan con novedades interesantes, ya que por ejemplo, ahora pueden alternar entre razonamiento y uso de herramientas dentro de un mismo proceso, lo que permite respuestas más completas, mientras que también se mejoró la confiabilidad y según Anthropic, son un 65 por ciento menos propensos a tomar atajos o a cometer errores graves que Sonnet 3.7.

Claude Opus 4 y Sonnet 4 ya están disponibles en la API de Anthropic, en Amazon Bedrock y en Google Cloud Vertex AI y están incluidos en los planes Pro, Max, Team y Enterprise.

Los precios se mantienen en la línea de los modelos anteriores: Opus 4 cuesta 15 dólares por millón de tokens de entrada y 75 por millón de tokens de salida y Sonnet 4 es más económico: 3 y 15 dólares de manera respectiva, aunque este último, también puede ser utilizado desde cuentas gratuitas.

Nomyc-23-5-25

Consultá por este producto

Cargando

Anthropic lanza Claude Opus 4 y lo presenta como el mejor modelo de programación del mundo

Categoría: TECNOLÓGICAS

Características

Consultá por este producto

NOTICIAS con contraseña

NOTICIAS
con contraseña