InformesPublicadohace 2 mesesLast edited el mes pasado37 fuentes

Claude Opus 4.8: Anthropic presenta su IA más honesta y barata para desarrolladores

Claude Opus 4.8 ya está disponible al mismo precio que su predecesor ($5/$25 por millón de tokens de entrada/salida) [5][26]. El modelo es cuatro veces menos propenso a pasar por alto errores en su propio código, según las evaluaciones de Anthropic [3][42].

Buscar y verificar hechos con Studio Global AI Explora más páginas en tendencia

What is Anthropic's newly released Claude Opus 4.8 model, including its benchmark improvements over Opus 4.7, key features like effort contrAnthropic's Claude Opus 4.8 is a direct upgrade to Opus 4.7 with improved coding, honesty, and user controls, all at the same price.

Prompt de IA

Create a landscape editorial hero image for this Studio Global article: What is Anthropic's newly released Claude Opus 4.8 model, including its benchmark improvements over Opus 4.7, key features like effort contr. Article summary: **Model:** Claude Opus 4.8 is listed in the official Claude API pricing table and is also listed as a model supported by fast mode.. Topic tags: deepresearch, general web, user generated, documentation. Reference image context from search candidates: Reference image 1: visual subject "Anthropic released Claude Opus 4.8 today, and it outperforms its predecessor across most major benchmarks while beating OpenAI’s GPT-5.5 and Google’s Gemini 3.1 Pro in several key" source context "Anthropic Just Dropped Claude Opus 4.8. - The VC Corner" Reference image 2: visual subject "Anthropic released Claude Opus 4.8 today, and it outperforms its predecessor across most major

openai.com

Anthropic ha lanzado Claude Opus 4.8 este 28 de mayo de 2026, sustituyendo a Opus 4.7 como su modelo de IA público más potente. No se trata de una revolución total, sino de una actualización quirúrgica: refuerza su honestidad, pule su rendimiento en programación y añade nuevos controles para el usuario. Y todo manteniendo el mismo precio .

La propia compañía califica a Opus 4.8 como "un colaborador más eficaz", construido sobre los cimientos de Opus 4.7 con mejoras en todos los benchmarks . Traducido a la práctica: es un modelo más difícil de engañar para que apruebe código con errores, más manejable para desarrolladores y usuarios, y mucho más barato de usar a máxima velocidad.

Mejoras en los benchmarks frente a Opus 4.7

Los números respaldan la mejora. En SWE-Bench Verified, el estándar de oro para resolver fallos de programación reales, Opus 4.8 sube hasta un 88,6%, desde el 87,6% de Opus 4.7 .

Donde realmente marca distancias es en SWE-Bench Pro, un benchmark más complejo para programación autónoma en múltiples lenguajes. Aquí Opus 4.8 alcanza un 69,2%: 4,9 puntos más que Opus 4.7 (64,3%) y una brecha de más de 10 puntos frente a GPT-5.5 (58,6%) y Gemini 3.1 Pro (54,2%) .

En Terminal-Bench 2.1, que evalúa el uso de la línea de comandos, Opus 4.8 llega al 74,6%. Sigue por detrás del 78,2% de GPT-5.5, pero supone un salto considerable frente al 66,1% de Opus 4.7 . Para uso autónomo del ordenador, en OSWorld-Verified, Opus 4.8 anota un 83,4%, superando ligeramente a Opus 4.7 (82,8%) y con claridad a GPT-5.5 (78,7%) .

En tareas de conocimiento profesional, medidas por GDPval-AA, Opus 4.8 logra una puntuación Elo de 1890, muy por delante de GPT-5.5 (1769) y Gemini (1314) . En el exigente Humanity's Last Exam de razonamiento multidisciplinar, alcanza un 57,9% con herramientas (frente al 49,8% sin ellas), la mejor nota de Anthropic para un modelo de acceso general .

Más honesto y mejor alineado: una IA en la que confiar

El gran salto cualitativo está en la honestidad del modelo. Según las evaluaciones internas de Anthropic, Opus 4.8 es unas cuatro veces menos propenso que Opus 4.7 a ignorar fallos en el código que él mismo escribe .

Las tasas de comportamientos desalineados —engaños o colaboración con usos maliciosos— son significativamente más bajas que en Opus 4.7 y comparables a las de Claude Mythos Preview, considerado el modelo mejor alineado de la compañía . Esto es crucial para desarrolladores que dependen de la IA para revisar o generar código en producción y necesitan un modelo que señale sus propios puntos ciegos.

Control de esfuerzo: ahora decides cuánto "piensa" Claude

El cambio más visible para el usuario es el nuevo dial de control de esfuerzo, ya disponible en claude.ai y en la interfaz Cowork . Permite elegir cuánta capacidad de cómputo dedica Claude a cada respuesta, con varios niveles:

Bajo: respuestas más rápidas que consumen menos límite de uso.
Alto: el nuevo valor por defecto en Opus 4.8. Equilibra calidad y velocidad.
Extra (llamado xhigh en Claude Code): razonamiento más profundo, recomendado para tareas difíciles y flujos de trabajo de larga duración.
Máximo: la máxima profundidad para los problemas más complejos .

En Claude Code, Anthropic ha aumentado los límites de uso para adaptarse al mayor consumo de tokens que implican los niveles altos . Esto da a los desarrolladores un control más fino sobre el equilibrio entre latencia, coste y profundidad de razonamiento.

Flujos de trabajo dinámicos: migraciones de código a gran escala

Para desarrolladores que abordan proyectos muy ambiciosos, Anthropic estrena los flujos de trabajo dinámicos como vista previa de investigación en Claude Code. Disponible para suscriptores de los planes Enterprise, Team y Max .

Esta funcionalidad permite que Claude planifique una tarea y luego ejecute cientos de subagentes en paralelo dentro de una misma sesión. Los resultados se verifican antes de ser comunicados, lo que lo hace válido para migraciones que afectan a cientos de miles de líneas de código .

Precio sin cambios y un modo rápido mucho más barato

El precio estándar de Opus 4.8 no varía respecto a Opus 4.7: 5 dólares por millón de tokens de entrada y 25 dólares por millón de tokens de salida . Las tarifas de escritura y refresco de caché de prompt se mantienen iguales al resto de la gama Opus .

La novedad real está en el modo rápido. Con Opus 4.8, el modo rápido es hasta 2,5 veces más veloz en la generación de tokens de salida y ahora cuesta 10 dólares por millón de tokens de entrada y 50 dólares por millón de tokens de salida . Esto es tres veces más barato que el modo rápido de Opus 4.6 y 4.7, que costaba 30 y 150 dólares respectivamente . Anthropic ha descontinuado el modo rápido para Opus 4.6 y recomienda migrar al modo rápido de Opus 4.8 o 4.7 .

Para usar el modo rápido desde la API, los desarrolladores deben configurar


speed: "fast"

con el identificador de modelo claude-opus-4-8 e incluir la cabecera beta fast-mode-2026-02-01 .

Disponibilidad en la API

El modelo ya está disponible a través de la API de Claude usando el alias claude-opus-4-8, y es compatible con modo rápido, caché de prompt y procesamiento por lotes . Los clientes de los planes Pro, Max, Team y Enterprise pueden acceder desde hoy mismo .

Proyecto Glasswing y la inminente llegada de los modelos Mythos

Junto al lanzamiento de Opus 4.8, Anthropic ha afinado su calendario para hacer públicos los modelos de clase Mythos. Desde el 7 de abril de 2026, Claude Mythos Preview ha estado limitado a unos 50 socios de seguridad defensiva bajo el Proyecto Glasswing , por su enorme capacidad en ciberseguridad ofensiva .

Este 28 de mayo, la compañía ha actualizado su discurso y afirma que planea lanzar los modelos Mythos para todos los clientes "en las próximas semanas" . Es la fecha más concreta ofrecida hasta ahora y se produce tras anunciar una ronda de financiación Serie H de 65.000 millones de dólares con una valoración posterior de 965.000 millones .

Lo que significa para desarrolladores y empresas

Claude Opus 4.8 es una mejora incremental con tres consecuencias prácticas:

Migrar desde Opus 4.7 es inmediato: mismo precio, mejores benchmarks de programación y una autoevaluación mucho más honesta sobre la calidad del código .
El modo rápido ya no es prohibitivo: a 10 y 50 dólares, el modo rápido se convierte en una opción viable para muchas más cargas de trabajo en producción, frente a los antiguos 30 y 150 dólares .
Los modelos Mythos están al caer: la fase de prueba restringida toca a su fin y el acceso general por API se anuncia para las próximas semanas, aunque faltan detalles sobre controles de seguridad .

Para los equipos que evalúan si dar el salto, la recomendación más sólida es probar Opus 4.8 directamente en sus propias tareas de programación, trabajo con agentes y proyectos de conocimiento. Sobre todo en sesiones largas donde la autocorrección, las advertencias de incertidumbre y la orquestación de subagentes en paralelo marcan la diferencia.

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Buscar y verificar hechos con Studio Global AI

La gente también pregunta

¿Cuál es la respuesta corta a "Claude Opus 4.8: Anthropic presenta su IA más honesta y barata para desarrolladores"?

Claude Opus 4.8 ya está disponible al mismo precio que su predecesor ($5/$25 por millón de tokens de entrada/salida) [5][26].

¿Cuáles son los puntos clave a validar primero?

¿Qué debo hacer a continuación en la práctica?

Incluye un nuevo control de esfuerzo en claude.ai y flujos de trabajo dinámicos en Claude Code para migraciones de código a gran escala [2][62].

Fuentes

← Back to Trending