Im direkten Vergleich mit dem Vorgänger legt Opus 4.8 messbar zu. Auf SWE-Bench Verified, dem Goldstandard für die Lösung echter Software-Bugs, erreicht das Modell 88,6 % – nach 87,6 % bei Opus 4.7 .
Deutlicher fällt der Sprung beim anspruchsvolleren, mehrsprachigen Agentic-Coding-Benchmark SWE-Bench Pro aus. Hier erreicht Opus 4.8 69,2 %, ein Plus von 4,9 Prozentpunkten gegenüber Opus 4.7 (64,3 %) und ein zweistelliger Vorsprung vor GPT-5.5 (58,6 %) und Gemini 3.1 Pro (54,2 %) .
Auf Terminal-Bench 2.1, der Kommandozeilen-Agentenfähigkeiten testet, erzielt Opus 4.8 74,6 %. Es bleibt damit hinter GPT-5.5 (78,2 %) zurück, macht aber einen großen Satz gegenüber Opus 4.7 (66,1 %) . Bei agentengestützter Computer-Nutzung (OSWorld-Verified) erreicht Opus 4.8 83,4 % und zieht knapp an Opus 4.7 (82,8 %) und GPT-5.5 (78,7 %) vorbei
.
Bei Wissensarbeit, gemessen mit GDPval-AA, erreicht Opus 4.8 einen Elo-Wert von 1890 – deutlich vor GPT-5.5 (1769) und mit weitem Abstand zu Gemini (1314) . Bei Humanity's Last Exam, einer multidisziplinären Denksportaufgabe, erzielt es 57,9 % mit Werkzeugnutzung – das beste allgemein zugängliche Ergebnis von Anthropic – gegenüber 49,8 % ohne Werkzeuge
.
Die sichtbarste Neuerung für Anwender ist ein Schieberegler für den Denkaufwand, der nun auf claude.ai und in der Cowork-Oberfläche verfügbar ist . Nutzer können wählen, wie viel „Rechenleistung" Claude in eine Antwort investiert:
xhigh): Gründlicheres, tieferes Nachdenken, empfohlen für schwierige Aufgaben und langlaufende Arbeitsabläufe.In Claude Code hat Anthropic zudem die Ratenlimits erhöht, um den höheren Token-Verbrauch der intensiveren Denkstufen zu ermöglichen . Entwickler erhalten so feinere Stellschrauben, um Latenz, Kosten und Argumentationstiefe bei komplexen Coding- und Agentenaufgaben abzuwägen.
Für die wirklich großen Aufgaben führt Anthropic eine Forschungsvorschau dynamischer Workflows in Claude Code ein, die Abonnenten der Enterprise-, Team- und Max-Tarife nutzen können .
Das Feature erlaubt es Claude, eine Aufgabe zu planen und dann Hunderte paralleler Subagenten in einer einzigen Sitzung zu starten. Die Ergebnisse werden vor der Rückmeldung geprüft – ideal für Migrationen einer gesamten Codebasis über Hunderttausende von Codezeilen hinweg .
Beim Preis bleibt alles beim Alten: Die Standardnutzung von Opus 4.8 kostet genau wie der Vorgänger 5 US-Dollar pro Million Input-Token und 25 US-Dollar pro Million Output-Token . Auch die Schreib- und Aktualisierungsraten für den Prompt-Cache bleiben auf dem Premium-Niveau der Opus-Klasse
.
Die größere Veränderung gibt es beim sogenannten „Fast Mode", also dem schnellen Modus. Dieser liefert eine bis zu 2,5-fach schnellere Token-Ausgabe und kostet nun 10 Dollar pro Million Input-Token und 50 Dollar pro Million Output-Token . Das ist dreimal günstiger als der Fast Mode bei den Vorgängermodellen Opus 4.6 und Opus 4.7, wo noch 30 bzw. 150 Dollar fällig wurden
. Den Fast Mode für Opus 4.6 hat Anthropic eingestellt und rät Nutzern, auf die schnellen Modi von Opus 4.8 oder 4.7 umzusteigen
.
Entwickler, die den schnellen Modus über die API nutzen wollen, setzen speed: "fast"claude-opus-4-8 und binden den Beta-Header fast-mode-2026-02-01 ein . Der Preis berechnet sich als Multiplikator auf die Standardraten über das gesamte Eingabe-Kontextfenster von über 200.000 Token und ist mit anderen Preis-Modifikatoren wie Prompt-Caching und Datenresidenz kombinierbar
.
Das Modell ist ab sofort über die Claude-API unter dem Alias claude-opus-4-8 verfügbar und unterstützt Fast Mode, Prompt-Caching und Stapelverarbeitung . Sowohl die API-Dokumentation als auch die Plattform-Veröffentlichungsnotizen bestätigen die sofortige Verfügbarkeit für Nutzer der Tarife Pro, Max, Team und Enterprise
.
Parallel zu Opus 4.8 hat Anthropic seine Aussagen zur Markteinführung der noch leistungsfähigeren Mythos-Modelle konkretisiert. Seit dem 7. April 2026 ist Claude Mythos Preview im Rahmen des Projekts Glasswing auf etwa 50 Partner für defensive Cybersicherheit beschränkt . Die offensiven Cyberfähigkeiten des Modells waren so stark, dass Anthropic es von einer öffentlichen Veröffentlichung zurückhielt
.
Nun erklärte das Unternehmen am 28. Mai, es plane, Mythos-Klasse-Modelle innerhalb der kommenden Wochen für alle Kunden freizugeben . Das ist die konkreteste Zeitangabe seit dem Start von Glasswing. Gleichzeitig gab Anthropic eine Series-H-Finanzierungsrunde über 65 Milliarden Dollar bei einer Bewertung von 965 Milliarden Dollar nach der Finanzierung bekannt – ein Signal, dass der kommerzielle Weg für die Mythos-Modelle von der Forschungsvorschau in Richtung allgemeiner Verfügbarkeit führt
.
Claude Opus 4.8 ist ein inkrementelles Upgrade, das Entwicklern drei handfeste Vorteile bringt:
Für Teams, die einen Wechsel abwägen, ist der stärkste Lackmustest, Opus 4.8 direkt an den eigenen Coding-, Agenten- und Wissensarbeits-Aufgaben zu testen. Besonders bei langlaufenden Sitzungen, wo Selbstkorrektur, das Markieren von Unsicherheiten und die parallele Orchestrierung von Subagenten den Unterschied machen.
Comments
0 comments