Claude Mythos Preview lässt sich am saubersten als neues Claude-Modell mit Preview- beziehungsweise Early-Access-Charakter verstehen, nicht als neue Claude-App oder eigene Firma. Anthropic nennt das Modell in der System Card beim Namen; TechCrunch beschreibt Mythos als Preview eines leistungsstarken neuen Anthropic-Modells.[2][
5][
8]
Auffällig ist, worum sich die öffentliche Aktenlage dreht: weniger um typische Produktfunktionen, mehr um Sicherheit. Anthropic stellt Mythos als deutlichen Fähigkeitszuwachs gegenüber Claude Opus 4.6 dar und beschreibt zugleich Red-Team-Ergebnisse, in denen das Modell autonom Exploits schrieb beziehungsweise Schwachstellen ausnutzte.[4][
8]
Was ist Claude Mythos Preview?
Die nüchternste Einordnung lautet: Mythos ist ein Preview-Modell aus der Claude-Familie. Anthropic führt es als Claude Mythos Preview, TechCrunch spricht von einer Preview eines neuen Anthropic-KI-Modells.[2][
8]
Das ist wichtig, weil der Name zu Spekulationen einlädt. Die verfügbaren Quellen stützen nicht die Annahme, dass Claude Mythos Preview eine separate Firma, eine eigenständige Verbraucher-App oder eine reguläre Claude-Stufe ist, die jeder frei auswählen kann.[2][
5][
8]
Was Anthropic über die Fähigkeiten sagt
Die stärkste veröffentlichte Fähigkeitsaussage stammt aus Anthropics System-Card-Material: Claude Mythos Preview sei deutlich leistungsfähiger als Claude Opus 4.6.[8] Opus 4.6 wird dort zugleich als das leistungsfähigste Modell bezeichnet, das im jüngsten Risk Report behandelt wurde – es ist also der zentrale Vergleichsmaßstab für Mythos.[
8]
Gleichzeitig ist die Einschränkung entscheidend. Anthropic schreibt auch, dass Mythos Preview für die Gesamtbewertung des Risikos ein effektiv ähnliches Profil habe. Außerdem seien einige Multi-Turn-Evaluationen, also Tests über mehrere Dialogrunden, mit Claude Opus 4.6 und Claude Sonnet 4.6 innerhalb der Fehlermarge vergleichbar gewesen.[8]
| Frage | Was belegt ist | Einordnung |
|---|---|---|
| Liegt Mythos über Opus 4.6? | Anthropic beschreibt Claude Mythos Preview als deutlich leistungsfähiger als Claude Opus 4.6.[ | Das spricht für einen allgemeinen Sprung, aber nicht automatisch für einen Sieg in jedem denkbaren Benchmark. |
| Wie passt Sonnet 4.6 ins Bild? | Bei einigen Multi-Turn-Evaluationen lagen die Ergebnisse laut Anthropic innerhalb der Fehlermarge von Opus 4.6 und Sonnet 4.6.[ | Sonnet bleibt ein nützlicher Vergleichspunkt, ist aber nicht der Kern der großen Fähigkeitsaussage. |
| Ist das Risikoprofil völlig neu? | Anthropic sagt, Mythos sei leistungsfähiger als frühere Modelle; für die Gesamtbewertung sei das Profil aber effektiv ähnlich.[ | Mehr Leistung bedeutet nach der veröffentlichten Bewertung nicht, dass jede Risikokategorie neu eingestuft wurde. |
Warum Cybersecurity bei Mythos so stark im Vordergrund steht
Die konkretesten technischen Details betreffen Schwachstellen- und Exploit-Tests. Anthropic schreibt, Mythos Preview habe anspruchsvolle Exploits für bereits gepatchte Fehler vollständig autonom erstellen können.[4]
Noch deutlicher ist ein Beispiel aus dem Red-Team-Bericht: Mythos Preview habe eine 17 Jahre alte Remote-Code-Execution-Schwachstelle in FreeBSD autonom erkannt und ausgenutzt. Auf einem Rechner mit NFS, dem Network File System, konnte diese Lücke Root-Zugriff ermöglichen.[4]
Das macht Mythos nicht automatisch zu einem öffentlich nutzbaren Angriffswerkzeug. Die vorliegenden Quellen zeigen gerade keine uneingeschränkte breite Freigabe für offensive Cybersecurity-Nutzung.[2][
4][
5] Sie erklären aber, warum Zugangskontrolle, Monitoring, Red-Teaming und Missbrauchsprävention im Mittelpunkt stehen. TechCrunch setzt seinen Bericht ebenfalls stark in einen Sicherheitskontext; CrowdStrike zieht den breiteren Schluss, dass leistungsfähigere KI-Systeme auch stärkere Sicherheitspraktiken brauchen.[
1][
2]
Kann man Claude Mythos Preview schon nutzen?
Nach den vorliegenden Quellen ist Claude Mythos Preview nicht als reguläre, breit verfügbare Claude-Option belegt. TechCrunch nennt Mythos eine Preview, und Fortune berichtete, Anthropic habe nach einem Datenleck mit Tests bei Early-Access-Kunden begonnen.[2][
5]
Für Entwicklerteams und Sicherheitsabteilungen heißt das praktisch: Mythos sollte nicht als bereits frei einplanbares Produktionsmodell behandelt werden, solange Anthropic keine offiziellen Zugangs- und Bereitstellungsregeln veröffentlicht. Am stärksten belegt sind derzeit die Modellpositionierung, der Fähigkeitsvergleich und die Sicherheitstests – nicht die breite Verfügbarkeit.[2][
4][
5][
8]
Wie man die Leak-Berichte lesen sollte
Fortune berichtete, Entwurfsmaterial in einem ungesicherten, öffentlich durchsuchbaren Datenspeicher habe die Existenz des Modells offengelegt. In diesem Material sei der Name Claude Mythos gefallen; außerdem habe es geheißen, Anthropic sehe beispiellose Cybersicherheitsrisiken.[5]
Diese Passage ist wichtig, sollte aber vorsichtig gelesen werden: Laut Fortune ging es um Entwurfsmaterial, nicht um eine finale öffentliche Produktseite.[5] Anthropics eigenes System-Card-Material klingt kontrollierter: Mythos Preview sei leistungsfähiger als frühere Modelle, sein Profil sei für die Gesamtbewertung des Risikos aber effektiv ähnlich.[
8]
Die sauberste Lesart ist daher nicht, dass sich die Quellen schlicht widersprechen. Eher treffen zwei Dinge zusammen: eine starke Fähigkeitsaussage und besonders sensible Cybersecurity-Beobachtungen in Tests.[4][
5][
8]
Was man nicht hineinlesen sollte
Mythos ist nicht einfach ein umbenanntes Opus
Anthropic vergleicht Claude Mythos Preview direkt mit Claude Opus 4.6 und beschreibt Mythos als deutlich leistungsfähiger.[8] Eine reine Umbenennung passt daher schlecht zu den verfügbaren Belegen.
Die Fähigkeitsaussage ist kein Freibrief für jede Benchmark-Behauptung
Anthropics stärkste Aussage betrifft die Gesamtfähigkeit im Vergleich zu Opus 4.6.[8] Weil einige Multi-Turn-Ergebnisse innerhalb der Fehlermarge von Opus 4.6 und Sonnet 4.6 lagen, sollte daraus nicht abgeleitet werden, Mythos dominiere jede Aufgabe.[
8]
Ein sicherheitslastiger Preview ist keine öffentliche Exploit-Freigabe
Die Red-Team-Ergebnisse sind bedeutsam, weil sie autonomes Exploit-Verhalten in Tests beschreiben.[4] Sie belegen aber für sich genommen keine uneingeschränkte öffentliche Verfügbarkeit und keine breite Freigabe für offensive Nutzung.[
2][
4][
5]
FAQ
Ist Claude Mythos dasselbe wie Claude Opus?
Nein. Anthropic vergleicht Claude Mythos Preview mit Claude Opus 4.6 und sagt, Mythos Preview sei deutlich leistungsfähiger.[8]
Ist Claude Mythos ein Cybersecurity-Produkt?
Die Quellen beschreiben Claude Mythos Preview als Claude-Modell im Preview-Stadium, nicht als eigenständiges Cybersecurity-Produkt.[2][
8] Cybersecurity steht im Mittelpunkt, weil Anthropic in Red-Team-Tests autonomes Exploit-Schreiben und Schwachstellenausnutzung beobachtet hat.[
4]
Kann jeder Claude Mythos Preview verwenden?
Dafür gibt es in den zitierten öffentlichen Quellen keinen Beleg. TechCrunch spricht von einer Preview, Fortune von Tests mit Early-Access-Kunden nach einem Datenleck.[2][
5]
Fazit
Claude Mythos Preview ist vor allem deshalb relevant, weil Anthropic einen deutlichen Fähigkeitssprung gegenüber Claude Opus 4.6 beschreibt und zugleich konkrete Red-Team-Belege für fortgeschrittene autonome Schwachstellenausnutzung veröffentlicht hat.[4][
8] Nach aktuellem Stand ist Mythos am besten als Claude-Modell im Preview-Stadium zu verstehen – nicht als normaler Massenstart. Die zentrale Geschichte ist daher weniger ein Modellranking als die Frage, wie Zugang, Kontrolle und Sicherheit bei sehr leistungsfähigen KI-Systemen organisiert werden.[
2][
4][
5][
8]




