AntwortenVeröffentlichtvor 2 MonatenLast edited letzten Monat18 Quellen

Cloudflare entdeckt: KI kann Software‑Fehler zu funktionierenden Angriffen verketten

Cloudflare testete Anthropics Claude Mythos Preview auf mehr als 50 internen und Open‑Source‑Codebasen – und stellte fest, dass die KI mehrere kleine Softwarefehler zu vollständigen Exploit‑Ketten kombinieren kann. Das Modell konnte automatisch Proof‑of‑Concept‑Exploitcode erzeugen, ausführen und iterativ verbessern...

Suchen und Fakten prüfen mit Studio Global AI Mehr Trendseiten ansehen

Illustration representing an AI system analyzing code and linking vulnerabilities into an exploit chain — What did Cloudflare find when testing Anthropic’s Claude Mythos Preview on more than 50 internal and open-source code repositories, specificSecurity researchers found Anthropic’s Claude Mythos Preview could link multiple vulnerabilities into working exploit chains during testing on more than 50 repositories.
KI-Prompt
Create a landscape editorial hero image for this Studio Global article: What did Cloudflare find when testing Anthropic’s Claude Mythos Preview on more than 50 internal and open-source code repositories, specific. Article summary: Cloudflare tested Mythos Preview as part of Project Glasswing against more than 50 of its own internal and open-source code repositories.. Topic tags: general, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# Claude Mythos: Benchmark-Dominating AI with Real Risks. Claude Mythos Preview is Anthropic’s most powerful AI yet, outperforming benchmarks and uncovering critical vulnerabilitie" source context "Claude Mythos: Benchmark-Dominating AI with Real Risks" Reference image 2: visual subject "Artificial Intelligence (AI) company Anthropic announced a new cybersecurity initiative called **Project Gla
openai.com

Cloudflare hat ein ungewöhnliches Experiment durchgeführt: Die Sicherheitsforscher des Unternehmens ließen Anthropics spezialisiertes KI‑Modell Claude Mythos Preview auf reale Softwareprojekte los. Getestet wurde die KI auf mehr als 50 internen sowie Open‑Source‑Code‑Repositories im Rahmen des eingeschränkten Programms Project Glasswing, das sich auf KI‑gestützte Cybersicherheitsforschung konzentriert.

Das Ergebnis: Die KI fand nicht nur einzelne Schwachstellen. Sie konnte mehrere kleine Fehler zu funktionierenden Angriffsketten kombinieren und automatisch Exploit‑Code erzeugen – eine Fähigkeit, die normalerweise erfahrenen Sicherheitsexperten vorbehalten ist.

Von einzelnen Bugs zu kompletten Angriffspfaden

Die meisten automatisierten Sicherheits‑Tools arbeiten nach einem einfachen Prinzip: Sie scannen Software nach einzelnen Schwachstellen und melden diese separat.

Cloudflare beobachtete jedoch, dass Mythos einen Schritt weiter ging.

Beim Analysieren realer Codebasen konnte das Modell:

mehrere scheinbar harmlose Schwachstellen mit niedriger Priorität erkennen
verstehen, wie diese Fehler technisch zusammenwirken
sie zu einer kompletten Exploit‑Kette verbinden, die einen echten Angriffspfad ermöglicht

Statt isolierte Bugs zu betrachten, modellierte die KI also, wie ein Angreifer mehrere Schwächen kombinieren könnte, um ein System tatsächlich zu kompromittieren. Dieses Verhalten zeigte sich in verschiedenen Teilen der Cloudflare‑Infrastruktur, darunter Laufzeitsysteme, Protokoll‑Code, Control‑Plane‑Komponenten und Open‑Source‑Projekte.

Automatische Erstellung von Exploit‑Code

Eine weitere bemerkenswerte Fähigkeit war die automatische Generierung von Proof‑of‑Concept‑Exploits (PoC).

Laut Cloudflare konnte Mythos:

Code schreiben, der eine Schwachstelle gezielt auslöst
diesen Code in einer Testumgebung kompilieren und ausführen
das Ergebnis analysieren
seine Methode anpassen und erneut versuchen

Durch diesen iterativen Prozess konnte das Modell von der reinen Schwachstellen‑Erkennung zur praktischen Bestätigung eines funktionierenden Exploits gelangen – und das mit nur minimaler menschlicher Unterstützung.

Für Sicherheits‑Teams ist genau dieser Schritt oft entscheidend: Erst ein funktionierender PoC zeigt, ob ein Bug wirklich kritisch ist.

Hinweise auf fortgeschrittene Exploit‑Analyse

Auch Anthropic selbst beschreibt in der Dokumentation zu Mythos Preview ähnliche Fähigkeiten aus internen Tests. Dazu gehören unter anderem:

das Auffinden von Zero‑Day‑Schwachstellen in realen Open‑Source‑Codebasen
Reverse Engineering von Exploit‑Techniken in geschlossener Software
das Umwandeln bekannter, aber noch nicht gepatchter N‑Day‑Vulnerabilities in funktionierende Exploits

Diese Fähigkeiten zeigen, dass das Modell speziell auf strukturierte Sicherheitsanalyse und Exploit‑Logik trainiert wurde – nicht nur auf allgemeine Programmierung.

Schwächen: Fehlalarme und inkonsistente Sicherheitsregeln

Trotz der beeindruckenden Ergebnisse zeigte das Experiment auch deutliche Grenzen.

Fehlalarme

Das Modell meldete teilweise Schwachstellen, die sich in der Praxis nicht ausnutzen ließen oder falsch klassifiziert waren. Besonders Code in speicherunsicheren Sprachen wie C oder C++ erzeugte häufiger solche Fehlmeldungen, weshalb menschliche Überprüfung weiterhin notwendig bleibt.

Uneinheitliches Sicherheitsverhalten

Cloudflare stellte außerdem fest, dass das Modell uneinheitlich auf riskante Aufgaben reagierte.

In manchen Fällen erkannte Mythos zwar einen Exploit‑Pfad, verweigerte aber anschließend aufgrund interner Sicherheitsregeln die vollständige Demonstration. In anderen Situationen arbeitete es weiter, bevor es stoppte.

Diese Inkonsistenzen zeigen, wie schwierig es ist, leistungsfähige Sicherheits‑KI zu entwickeln, die gleichzeitig nützlich für Forscher und sicher gegenüber Missbrauch bleibt.

Warum das für die Cybersicherheit wichtig ist

Die Ergebnisse deuten auf einen möglichen Wandel in der Schwachstellenforschung hin.

Für Verteidiger könnten solche Modelle:

komplexe Angriffsketten entdecken, die klassische Scanner übersehen
schneller prüfen, ob ein Bug wirklich ausnutzbar ist
Sicherheits‑Teams helfen, kritische Schwachstellen schneller zu priorisieren

Gleichzeitig entsteht jedoch ein Risiko: Wenn KI automatisch den Weg von Bug‑Fund zu funktionierendem Exploit überbrücken kann, könnte die technische Einstiegshürde für Angriffe deutlich sinken.

Cloudflare zieht daraus eine klare Schlussfolgerung: Nur schneller zu patchen reicht möglicherweise nicht mehr aus. Sicherheitsstrategien müssen davon ausgehen, dass Angreifer künftig ähnliche automatisierte Werkzeuge einsetzen können.

Das klassische „Dual‑Use“-Problem

Claude Mythos Preview zeigt ein typisches Muster moderner Technologie: Dieselbe Fähigkeit kann schützen oder angreifen.

Für Sicherheitsforscher hilft sie, Schwachstellen frühzeitig zu entdecken.
In falschen Händen könnte sie die Entwicklung von Exploits massiv beschleunigen.

Aus diesem Grund ist das Modell derzeit nicht öffentlich verfügbar. Stattdessen wird es nur ausgewählten Organisationen im Rahmen von Project Glasswing für defensive Tests bereitgestellt.

Die Cloudflare‑Tests machen deutlich, wohin sich KI entwickelt: weg von einfachen Programmierhilfen hin zu Systemen, die komplexe Sicherheitslücken entdecken, analysieren und praktisch ausnutzen können. Diese Entwicklung könnte sowohl die Cyberabwehr als auch Cyberangriffe in den kommenden Jahren grundlegend verändern.

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Suchen und Fakten prüfen mit Studio Global AI

Die Leute fragen auch

Wie lautet die kurze Antwort auf „Cloudflare entdeckt: KI kann Software‑Fehler zu funktionierenden Angriffen verketten“?

Was sind die wichtigsten Punkte, die zuerst validiert werden müssen?

Was soll ich als nächstes in der Praxis tun?

Die Ergebnisse zeigen jedoch auch Probleme wie Fehlalarme und uneinheitliche Sicherheits‑Verweigerungen – und werfen größere Fragen zur Doppelverwendung solcher KI‑Tools für Verteidiger und Angreifer auf.

Quellen

← Back to Trending