RapportsPubliéil y a 2 moisLast edited le mois dernier24 sources

Claude Opus 4.8 : Anthropic muscle son IA avec plus d'honnêteté et un mode rapide trois fois moins cher

Claude Opus 4.8 atteint 69,2 % sur le benchmark de codage agentique SWE Bench Pro, dépassant GPT 5.5 (58,6 %) et Gemini 3.1 Pro (54,2 %), mais GPT 5.5 conserve l'avantage sur les tâches de codage en terminal [6][7]. Anthropic met l'accent sur la fiabilité : le modèle est quatre fois moins susceptible de laisser pass...

Rechercher et vérifier les faits avec Studio Global AI Voir plus de pages tendance

Conceptual illustration of Claude Opus 4.8's launch, symbolizing AI performance benchmarks and agentic coding capabilities. — What were the key details of Anthropic's Claude Opus 4.8 launch on May 28, 2026, including its benchmark performance against OpenAI's GPT 5Anthropic launched Claude Opus 4.8 with significant improvements in agentic coding and model reliability. Image: AI-generated.
Prompt IA
Create a landscape editorial hero image for this Studio Global article: What were the key details of Anthropic's Claude Opus 4.8 launch on May 28, 2026, including its benchmark performance against OpenAI's GPT 5.. Article summary: **Launch positioning:** Claude Opus 4.8 was described as outperforming Opus 4.7 across most major benchmarks and beating GPT-5.5 and Gemini 3.1 Pro in several categories.. Topic tags: deepresearch, general web, user generated, documentation. Reference image context from search candidates: Reference image 1: visual subject "Anthropic released Claude Opus 4.8 today, and it outperforms its predecessor across most major benchmarks while beating OpenAI’s GPT-5.5 and Google’s Gemini 3.1 Pro in several key" source context "Anthropic Just Dropped Claude Opus 4.8. - The VC Corner" Reference image 2: visual subject "Anthropic released Claude Opus 4.8 today, and it outper
openai.com

Anthropic a officiellement lancé Claude Opus 4.8 le 28 mai 2026, succédant directement à Opus 4.7. Présenté comme son modèle public le plus performant, il cible le développement logiciel, les tâches agentiques de longue haleine et la robustesse en entreprise . Fait notable, la tarification standard ne bouge pas, tandis qu'un mode rapide nettement plus accessible et de nouveaux outils de workflow accompagnent cette sortie .

Des benchmarks qui redessinent le podium

La comparaison la plus commentée concerne le benchmark de codage agentique SWE-Bench Pro. Selon les évaluations internes d'Anthropic, Opus 4.8 y décroche un score de 69,2 %, contre 64,3 % pour la génération précédente, 58,6 % pour GPT-5.5 d'OpenAI et 54,2 % pour Gemini 3.1 Pro de Google .

Sur un ensemble plus large de tests, GPT-5.5 conserve des bastions. Sur Terminal-Bench 2.1, une évaluation de codage en ligne de commande, GPT-5.5 domine avec 78,2 %, devant les 74,6 % d'Opus 4.8 et les 70,3 % de Gemini 3.1 Pro .

Pour les tâches de travail intellectuel à forte valeur économique, Opus 4.8 réalise un score de 1890 sur l'évaluation GDPval-AA, surpassant GPT-5.5 (1769) et Gemini (1314) . Sur l'ensemble des catégories mesurées, Anthropic revendique une supériorité dans plusieurs domaines clés, sans pour autant prétendre à une victoire absolue .

L'honnêteté et la fiabilité comme véritables arguments techniques

Délaissant la seule course à la puissance brute, Anthropic a lourdement insisté sur la fiabilité du modèle. L'entreprise affirme qu'Opus 4.8 est environ quatre fois moins susceptible qu'Opus 4.7 de laisser passer sans commentaire des failles dans le code qu'il génère .

Les premiers retours de testeurs soulignent un modèle bien plus enclin à signaler ses doutes et moins prompt à avancer des affirmations non étayées lors de workflows complexes . Anthropic a explicitement érigé « l'honnêteté » en argument de vente, jugeant le modèle moins susceptible de présenter comme factuelles des informations insuffisamment sourcées .

Workflows dynamiques et réglage de l'effort : la boîte à outils du développeur

Au-delà du modèle de base, Anthropic déploie de nouvelles fonctionnalités pensées pour les utilisateurs avertis et les développeurs .

Workflows dynamiques : Disponible en avant-première dans Claude Code, cette fonctionnalité permet au modèle de planifier une mission, de l'orchestrer en répartissant des centaines de sous-agents en parallèle, puis de vérifier les résultats avant de les rapporter. Elle est conçue pour des migrations de code à grande échelle, l'audit ou la chasse aux bugs .

Contrôle de l'engagement / de l'effort : Les utilisateurs peuvent désormais dicter la profondeur de raisonnement du modèle. Le paramètre « effort », accessible sur claude.ai et dans Claude Code, permet un compromis entre intelligence, coûts de tokens et rapidité. La documentation recommande d'utiliser le niveau xhigh pour les tâches de codage et agentiques les plus ardues, et un minimum de high pour les autres usages sensibles .

Grille tarifaire : le bon élève de la stabilité

Les tarifs API restent inchangés par rapport à la génération précédente .

Tarif standard : 5 $ par million de tokens en entrée, 25 $ par million de tokens en sortie .
Tarif mode rapide : 10 $ en entrée, 50 $ en sortie. Ce mode est environ 2,5 fois plus rapide que le standard, et trois fois moins cher que les modes rapides des précédents modèles Opus .

La mise en cache est facturée 6,25 $ par million de tokens pour les écritures de 5 minutes, 10 $ pour une heure, et 0,50 $ pour les lectures et rafraîchissements .

Ce que cette sortie révèle du nouvel échiquier de l'IA

Claude Opus 4.8 n'est pas une simple mise à jour de puissance brute : c'est une mise à niveau ciblée sur les développeurs et les entreprises. Le récit commercial se recentre sur la fiabilité des agents, la gestion explicite des incertitudes et un contrôle granulaire du rapport coûts-performances par le réglage du niveau d'effort. Côté tarifs, le conservatisme est de mise avec une stabilité des prix standards, tandis que la baisse spectaculaire du mode rapide démocratise l'inférence ultra-rapide pour les applications les plus exigeantes en latence.

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Rechercher et vérifier les faits avec Studio Global AI

Les gens demandent aussi

Câu trả lời ngắn gọn cho "Claude Opus 4.8 : Anthropic muscle son IA avec plus d'honnêteté et un mode rapide trois fois moins cher" là gì?

Những điểm chính cần xác nhận đầu tiên là gì?

Tôi nên làm gì tiếp theo trong thực tế?

Les tarifs API standards restent stables à 5 $ par million de tokens en entrée et 25 $ en sortie ; le nouveau mode rapide (2,5x plus véloce) est facturé 10 $ / 50 $, soit trois fois moins cher qu'avant [1][4][77].

Sources

← Back to Trending