Gegenüber Medien wie der BBC und Moneycontrol führte Palmiotti aus, dass sich die Technologie in einem Tempo entwickle, bei dem selbst die Spitze des menschlichen Talents nicht mehr wettbewerbsfähig sein könnte. Sie prognostizierte, dass KI-Hacking-Wettbewerbe Veranstaltungen wie Pwn2Own obsolet machen könnten, weil die schiere Geschwindigkeit, Größenordnung und Autonomie von Systemen wie Mythos von keinem einzelnen Menschen – so talentiert er auch sei – erreicht werden kann .
Entscheidend ist, dass ihre Warnung nicht lautet, KI werde sofort alle Sicherheitsforscher ersetzen, sondern dass sie eine Fähigkeitsschwelle überschreitet, welche die Ökonomie dessen verändert, wer – oder was – die kritischsten Schwachstellen zuerst findet. Die Flugbahn, so ihr Argument, zeigt in Richtung Maschinen .
Claude Mythos Preview ist kein enges Cybersicherheitstool, sondern ein generalistisches Sprachmodell, Anthropics nächster Nachfolger der Claude-Reihe. Es wurde nicht speziell als Hacker trainiert. Doch als seine Fähigkeiten evaluiert wurden, schockierten die Ergebnisse selbst seine Entwickler .
Anthropic bestätigte, dass Mythos Preview tausende schwerwiegende Schwachstellen in allen großen Betriebssystemen und allen großen Webbrowsern autonom entdeckte. Darunter waren unbekannte – sogenannte Zero-Day-Lücken, die zuvor kein menschlicher Forscher gefunden hatte . Ein Bericht beschrieb, dass das Modell innerhalb von 21 Minuten 303 Seiten mit Schwachstellenfunden produzierte
.
Frühere KI-Modelle konnten zwar mitunter Schwachstellen finden, aber fast nie selbständig einen funktionierenden Exploit programmieren. Bei einem Benchmark, bei dem bekannte Schwachstellen in der JavaScript-Engine von Firefox in lauffähige Shell-Exploits umgewandelt werden sollten, war Mythos Preview 181 Mal erfolgreich. Das Vorgängermodell von Anthropic, Claude Opus 4.6, hatte eine Erfolgsquote von nahezu Null . Dies ist keine inkrementelle Verbesserung, sondern ein Schwellenübertritt
.
Mythos kann Closed-Source- oder kompilierte Software analysieren, selbst nachdem menschenlesbare Debug-Informationen entfernt wurden. Es untersucht rohen Maschinencode, versteht, wie das Programm funktioniert, und deckt Schwachstellen auf, die ohne Quelltextzugriff undurchsichtig blieben .
Forscher nutzten ein simples Agentengerüst: Sie containerisierten die Zielsoftware, riefen das Modell mit Claude Code und Mythos Preview auf und gaben einen einzigen Absatz als Prompt, der zur Schwachstellensuche aufforderte. Das Modell fand und exploitierte daraufhin selbständig zuvor unbekannte Sicherheitslücken . Das UK AI Security Institute (AISI) unterzog das Modell einer unabhängigen Prüfung und bestätigte seine fortgeschrittenen Cyber-Fähigkeiten
.
Anthropic machte deutlich, dass die offensiven Cyber-Fähigkeiten nicht gezielt antrainiert wurden. Sie seien „als Nebeneffekt allgemeiner Verbesserungen bei Code, Reasoning und Autonomie“ entstanden . Dieselben Fortschritte, die das Modell effektiver beim Schließen (Patchen) von Schwachstellen machen, machen es auch effektiver zu deren Ausnutzung. Das hat enorme Governance-Implikationen: Wenn Offensivfähigkeit eine emergente Eigenschaft allgemeiner Denkleistung ist, könnten zukünftige, noch leistungsfähigere Modelle unmöglich sicher zu machen sein, ohne ihre Intelligenz fundamental zu begrenzen
.
Als Anthropic Claude Mythos Preview im April 2026 veröffentlichte, tat das Unternehmen etwas, das noch kein großes KI-Labor zuvor getan hatte: Es kündigte sein leistungsstärkstes Modell an und teilte gleichzeitig mit, dass die Öffentlichkeit es nicht nutzen könne .
Das Unternehmen rief Project Glasswing ins Leben, ein Programm mit stark eingeschränktem Zugang. Es begrenzt Mythos Preview auf etwa 50 sorgfältig geprüfte Organisationen. Dazu zählen große Technologiekonzerne wie Apple, Amazon Web Services, Microsoft, Google, Cisco, CrowdStrike, Broadcom, Palo Alto Networks und Nvidia, Betreiber kritischer Infrastrukturen wie JPMorgan Chase, sowie US-Regierungsstellen wie die National Security Agency (NSA) . Ziel ist es, zuerst die kritischste Software der Welt abzuhärten und den Verteidigern einen Vorsprung zu verschaffen, bevor ähnlich fähige – oder noch mächtigere – offensive KI unweigerlich in falsche Hände gerät
.
Anthropics Argumentation ist einfach: Das Modell ist schlicht zu gefährlich für eine breite Freigabe. Das Unternehmen räumte ein, dass Mythos „den anderen KI-Modellen in Cyber-Fähigkeiten derzeit weit voraus“ sei und „eine kommende Welle von Modellen ankündigt, die Schwachstellen auf eine Weise ausnutzen können, die die Bemühungen der Verteidiger weit überholt“ . In den falschen Händen könnte es koordinierte Cyberangriffe auf Stromnetze, Krankenhäuser und Finanzsysteme orchestrieren
.
Die Lage spitzte sich zu, als Anthropic vorschlug, den Zugang von etwa 50 auf 120 Organisationen auszuweiten. Das Weiße Haus blockierte diese Erweiterung – der erste bekannte Fall, dass die US-Regierung die kommerzielle Ausrollung eines KI-Modells auf Basis politischer Erwägungen einschränkte, und nicht aufgrund eines konkreten Gesetzes oder einer Regulierung . Als Begründung führten Regierungsvertreter die Befürchtung an, das mächtige Modell könne in gegnerische Hände fallen, sowie Zweifel, ob Anthropic genügend Rechenkapazität habe, um einen erweiterten Nutzerkreis zu bedienen, ohne die Leistung für kritische Bundespartner zu beeinträchtigen
.
Zeitgleich kündigte das Pentagon KI-Partnerschaften für klassifizierte Netzwerke mit acht Unternehmen an – OpenAI, Google, Microsoft, AWS, Nvidia, SpaceX, Oracle und xAI – und ließ Anthropic bemerkenswerterweise von dieser Liste ausgeschlossen, was wachsende Spannungen zwischen dem Unternehmen und dem US-Verteidigungsapparat signalisiert .
Vorerst bleibt Mythos hinter verschlossenen Türen. Im Mai 2026 erhielten Japans drei Großbanken Zugang zu dem Modell – eines der ersten Länder außerhalb der USA, das es defensiv einsetzt .
Das Aufkommen von Claude Mythos hat eine dringliche philosophische Debatte in der Cybersicherheit entfacht. Haben menschliche Schwachstellenforscher eine tragfähige Zukunft, oder erleben wir gerade den Anfang vom Ende?
1. KI erweitert menschliche Fähigkeiten, ersetzt sie aber nicht vollständig. Palmiotti selbst setzt Claude Code ein, um ihre Effizienz zu erhöhen, und verlässt sich dabei weiter auf menschliches Geschick für Kontext und kreatives Reasoning. Viele Forscher argumentieren, dass menschliches Know-how für übergeordnete Strategie, das Verständnis von Zweck und Geschäftslogik eines Systems und die Entwicklung komplexer Angriffsketten unverzichtbar bleibt .
2. Zugangsbeschränkungen sichern vorerst menschliche Rollen. Der Zugang zu Mythos ist rigoros auf etwa 50 Organisationen begrenzt. Die überwältigende Mehrheit aller Bug-Bounty-Programme und Penetrationstests wird weiterhin von menschlichen Forschern durchgeführt, die weit weniger mächtige Werkzeuge nutzen. Das verändert die Frontier, löst aber nicht die riesige bestehende Industrie auf .
3. Neue Domänen und Urteilsvermögen. Menschen behalten Vorteile beim Aufspüren von Fehlern in der Geschäftslogik, bei nuancierten Social-Engineering-Bewertungen und bei kontextbezogenen Risikourteilen, die aktuelle KI-Modelle übersehen oder falsch interpretieren könnten. Eine KI mag einen technisch ausnutzbaren Pufferüberlauf finden; ein menschlicher Forscher kann beurteilen, ob dieser Pufferüberlauf im Geschäftskontext tatsächlich kritisch ist .
1. Reine Geschwindigkeit und Skalierung sind für Menschen unerreichbar. Mythos kann ganze Codebasen aufnehmen, Schwachstellen finden und Exploits in Minuten programmieren – Arbeit, die ein erfahrenes menschliches Team Wochen oder Monate kosten kann. Eine Publikation beschrieb es als „eine KI, die in fast jeden Computer der Welt eindringen kann“, nachdem sie gleichzeitig tausende unbekannte Lücken in allen großen Betriebssystemen gefunden hatte .
2. Elite-Wettkämpfe werden zu KI-Leistungsschauen. Palmiottis Vorhersage, dass Hacking-Wettbewerbe wie Pwn2Own obsolet werden könnten, ist kein bloßes Gefühl, sondern eine strukturelle Beobachtung. Wenn ein einziges Modell Schwachstellen findet und zu Angriffsketten verknüpft, für die es sonst mehrere Elite-Teams bräuchte, verschiebt sich die Ökonomie der Schwachstellensuche fundamental .
3. Überwältigende Kosten- und Effizienzvorteile. Ein einzelnes KI-System kann Millionen Codezeilen scannen, kleine Lücken zu kritischen Exploit-Ketten verbinden und in einer Größenordnung arbeiten, die kein Mensch dauerhaft leisten kann. Das verändert grundlegend, was in der Schwachstellenentdeckung möglich ist – nicht, weil Menschen ineffektiv sind, sondern weil sie in puncto Volumen nicht mithalten können .
Die Debatte wird sich kaum sauber auflösen lassen. Wahrscheinlicher ist eine Zweiteilung der unmittelbaren Zukunft: ein innerer Kreis KI-gestützter Verteidiger, die Systeme wie Mythos unter strikter staatlicher und unternehmerischer Aufsicht nutzen, und ein großer äußerer Kreis, in dem der Großteil der Sicherheitsarbeit hartnäckig und menschlich manuell bleibt. Der Abstand zwischen diesen beiden Kreisen schrumpft jedoch.
Comments
0 comments