RapportsPubliéil y a 2 moisLast edited le mois dernier35 sources

Claude Opus 4.8 débarque : plus honnête, plus performant et plus abordable en mode rapide

Anthropic a dévoilé Claude Opus 4.8, une mise à jour directe d'Opus 4.7, au même tarif attractif de 5 $ par million de tokens en entrée et 25 $ en sortie. La mise à jour introduit un contrôle de l'effort sur l'interface claude.ai et des workflows dynamiques dans Claude Code, capables d'orchestrer des centaines de so...

Rechercher et vérifier les faits avec Studio Global AI Voir plus de pages tendance

What is Anthropic's newly released Claude Opus 4.8 model, including its benchmark improvements over Opus 4.7, key features like effort contrAnthropic's Claude Opus 4.8 is a direct upgrade to Opus 4.7 with improved coding, honesty, and user controls, all at the same price.

Prompt IA

Create a landscape editorial hero image for this Studio Global article: What is Anthropic's newly released Claude Opus 4.8 model, including its benchmark improvements over Opus 4.7, key features like effort contr. Article summary: **Model:** Claude Opus 4.8 is listed in the official Claude API pricing table and is also listed as a model supported by fast mode.. Topic tags: deepresearch, general web, user generated, documentation. Reference image context from search candidates: Reference image 1: visual subject "Anthropic released Claude Opus 4.8 today, and it outperforms its predecessor across most major benchmarks while beating OpenAI’s GPT-5.5 and Google’s Gemini 3.1 Pro in several key" source context "Anthropic Just Dropped Claude Opus 4.8. - The VC Corner" Reference image 2: visual subject "Anthropic released Claude Opus 4.8 today, and it outperforms its predecessor across most major

openai.com

La course à l'intelligence artificielle ne connaît pas de répit. Ce 28 mai 2026, Anthropic a officiellement présenté Claude Opus 4.8, son nouveau modèle le plus performant accessible au public. Si cette nouvelle mouture ne constitue pas une révolution architecturale, elle apporte une série d'améliorations ciblées qui devraient intéresser autant les développeurs que les entreprises. Au programme : un modèle « plus honnête », des performances en hausse sur les tâches de codage complexes, de nouvelles options de contrôle pour les utilisateurs et une refonte bienvenue de la grille tarifaire du mode rapide .

Dans son billet de blog, Anthropic décrit Opus 4.8 comme « un collaborateur plus efficace » qui capitalise sur les acquis d'Opus 4.7 tout en améliorant ses résultats sur les principaux bancs d'essai . Concrètement, il s'agit d'un modèle plus difficile à tromper pour approuver du code de mauvaise qualité, plus facile à paramétrer et nettement moins cher à utiliser à haute vitesse.

Des performances en hausse constante

Claude Opus 4.8 affiche des progrès tangibles sur la suite d'évaluation d'Anthropic. Sur le test SWE-Bench Verified, la référence pour la correction de bugs en conditions réelles, il atteint 88,6 %, contre 87,6 % pour son prédécesseur .

Le bond le plus significatif se situe sur SWE-Bench Pro, un banc d'essai plus difficile couvrant plusieurs langages de programmation. Avec un score de 69,2 %, Opus 4.8 creuse l'écart avec GPT-5.5 (58,6 %) et Gemini 3.1 Pro (54,2 %) et devance Opus 4.7 de 4,9 points .

Sur Terminal-Bench 2.1, qui mesure la performance en codage agentique en ligne de commande, Opus 4.8 affiche un score de 74,6 %. Même s'il reste derrière GPT-5.5 (78,2 %), il surpasse largement Opus 4.7 (66,1 %) sur cette même évaluation . Pour les tâches d'utilisation agentique d'un ordinateur (OSWorld-Verified), Opus 4.8 obtient 83,4 %, devançant là aussi GPT-5.5 (78,7 %) .

En matière de travail de connaissance évalué par le benchmark GDPval-AA, Opus 4.8 atteint un score Elo de 1890, loin devant les 1769 de GPT-5.5 et les 1314 de Gemini . Enfin, sur l'examen pluridisciplinaire surnommé « Humanity's Last Exam », le modèle a obtenu un score de 57,9 % avec outils, le meilleur résultat jamais enregistré par un modèle grand public d'Anthropic .

Un modèle plus transparent et aligné

Au-delà de la puissance brute, Anthropic met en avant un aspect plus qualitatif : l'honnêteté. Selon les évaluations de l'entreprise, Opus 4.8 est à peu près quatre fois moins susceptible que son prédécesseur de laisser passer des erreurs dans son propre code sans les signaler .

Les taux de comportements « désalignés », comme la tromperie ou la coopération avec un usage malveillant, sont également en nette baisse par rapport à Opus 4.7. Ils sont désormais comparables à ceux de Claude Mythos Preview, qu'Anthropic considère comme son modèle le mieux aligné . C'est un argument de poids pour les professionnels qui intègrent l'IA dans leurs processus de développement et qui ont besoin d'un assistant capable de signaler ses angles morts plutôt que de livrer avec assurance un code défaillant.

Contrôle de l'effort : l'utilisateur reprend la main

L'une des nouveautés les plus notables de cette version est l'arrivée d'un curseur de contrôle de l'effort sur l'interface claude.ai et sur Cowork . Cette fonctionnalité, très attendue, permet à l'utilisateur de choisir la puissance de calcul que Claude va mobiliser pour chaque réponse, selon plusieurs paliers :

Faible : Des réponses plus rapides, qui consomment moins le quota de requêtes.
Élevé : Le mode par défaut pour Opus 4.8, qui offre le meilleur compromis entre qualité et vitesse.
Extra (appelé xhigh dans Claude Code) : Un niveau de raisonnement plus poussé, recommandé pour les tâches difficiles.
Max : La profondeur d'analyse maximale pour les problèmes les plus ardus .

Pour accompagner cette nouveauté, les limites de volume ont été revues à la hausse dans Claude Code, notamment pour les niveaux « Extra » et « Max », qui consomment davantage de tokens .

Workflows dynamiques : orchestrer le travail en grand

Pour les développeurs qui s'attaquent à des projets titanesques, Anthropic introduit une fonctionnalité très prometteuse en mode « research preview » dans Claude Code : les workflows dynamiques .

Cette fonction permet à Claude de planifier une tâche complexe, puis de lancer et d'exécuter des centaines de sous-agents en parallèle au sein d'une même session, avant de vérifier leurs résultats. C'est une solution idéale pour des migrations à grande échelle, comme le refactoring de centaines de milliers de lignes de code . Cette option est pour l'instant réservée aux abonnés des plans Enterprise, Team et Max.

Prix stables, mode rapide démocratisé

Bonne nouvelle pour les utilisateurs : la tarification standard d'Opus 4.8 reste exactement la même que celle d'Opus 4.7, à savoir 5 $ par million de tokens en entrée et 25 $ par million de tokens en sortie .

Le changement majeur concerne le « mode rapide ». Proposé comme une option pour Opus 4.8, il offre une vitesse de génération jusqu'à 2,5 fois plus élevée pour un coût de 10 $ par million de tokens en entrée et 50 $ en sortie . C'est trois fois moins cher que ce que coûtait le mode rapide pour les précédents modèles Opus 4.6 et 4.7, facturé 30 $ / 150 $ . Anthropic a d'ailleurs annoncé la dépréciation du mode rapide pour Opus 4.6 et invite les utilisateurs à migrer vers celui d'Opus 4.8 .

Disponibilité et accès

Le modèle est d'ores et déjà disponible via l'API Claude sous le nom claude-opus-4-8. Il est compatible avec le mode rapide, la mise en cache des prompts et les traitements par lots . Les abonnés aux plans Pro, Max, Team et Enterprise de Claude peuvent y accéder immédiatement .

Le projet Glasswing et l'ombre de Mythos

En parallèle de cette sortie, Anthropic a dévoilé une feuille de route plus précise concernant sa future famille de modèles Mythos. Depuis le 7 avril 2026, l'aperçu de Claude Mythos était strictement limité à une cinquantaine de partenaires en cybersécurité défensive, dans le cadre du Projet Glasswing, en raison de ses capacités offensives hors norme .

Le 28 mai, l'entreprise a franchi un nouveau cap dans sa communication en annonçant vouloir « mettre les modèles de classe Mythos à disposition de tous ses clients dans les semaines à venir » . C'est le signe le plus fort envoyé par l'entreprise concernant la sortie de cette architecture très attendue, même si les détails sur les garde-fous qui l'accompagneront restent à préciser. Pour soutenir ce développement, Anthropic a également officialisé une levée de fonds de 65 milliards de dollars, valorisant l'entreprise à 965 milliards de dollars .

Ce qu'il faut retenir

Claude Opus 4.8 s'impose comme une mise à jour pragmatique qui coche trois cases essentielles pour les professionnels :

Une transition sans couture pour les utilisateurs d'Opus 4.7, avec un prix inchangé, de meilleurs scores sur les bancs d'essai de codage et une auto-évaluation du code nettement plus fiable.
Un mode rapide désormais compétitif, qui tombe à 10/50 $ le million de tokens, rendant la haute vitesse accessible pour un bien plus large éventail d'applications en production.
La promesse de capacités inédites à l'horizon, avec un accès élargi aux modèles Mythos qui se profile. Pour les équipes techniques, le conseil est le même que d'habitude : tester le modèle directement sur vos propres cas d'usage, en particulier les sessions longues et complexes, pour mesurer les gains concrets en autonomie et en fiabilité.

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Rechercher et vérifier les faits avec Studio Global AI

Les gens demandent aussi

Câu trả lời ngắn gọn cho "Claude Opus 4.8 débarque : plus honnête, plus performant et plus abordable en mode rapide" là gì?

Anthropic a dévoilé Claude Opus 4.8, une mise à jour directe d'Opus 4.7, au même tarif attractif de 5 $ par million de tokens en entrée et 25 $ en sortie.

Những điểm chính cần xác nhận đầu tiên là gì?

Tôi nên làm gì tiếp theo trong thực tế?

Le mode rapide devient trois fois plus abordable, tandis qu'Anthropic annonce l'arrivée prochaine des modèles de classe Mythos, jusqu'ici réservés à des partenaires de cybersécurité.

Sources

← Back to Trending