Zum Zeitpunkt der Cisco-Ankündigung war keines dieser Modelle für die breite Öffentlichkeit zugänglich. Anthropic erachtete Claude Mythos Preview genau wegen seiner offensiven Cyber-Fähigkeiten als zu gefährlich für eine uneingeschränkte Freigabe und entschied sich stattdessen, es nur einem handverlesenen Konsortium von Industriepartnern unter strenger Aufsicht zur Verfügung zu stellen . Der Ansatz von OpenAI mit Daybreak war etwas breiter gefächert und bot gestaffelte Zugriffsebenen, darunter eine gesonderte „GPT-5.5-Cyber“-Stufe, die ausschließlich für Red-Team-Aktivitäten reserviert ist. Die leistungsfähigsten Fähigkeiten blieben jedoch geprüften Organisationen wie Cisco, CrowdStrike und Regierungsbehörden vorbehalten
.
Ciscos internes Grundgerüst für diese Modelle, die Cisco Foundry Security Spec, wurde an sechs verschiedenen KI-Frontier-Modellen getestet, um einen modellunabhängigen Betrieb sicherzustellen. In Ciscos eigenen Worten: „Das Modell ist der Beschleuniger, das Grundgerüst ist der Motor.“
Cisco ist Gründungsmitglied beider großer Industrieinitiativen, die darauf abzielen, Frontier-KI für die defensive Cybersicherheit zu nutzen.
Anthropics Project Glasswing: Das im April 2026 gestartete Project Glasswing gewährt einer sorgfältig ausgewählten Gruppe von Partnern unter strengen Auflagen Zugang zu Claude Mythos Preview. Ziel ist es, Schwachstellen in kritischer Software zu finden und zu schließen, bevor Angreifer sie ausnutzen können. Zu den Gründungsteilnehmern gehören AWS, Apple, Google, Microsoft, Nvidia, CrowdStrike, die Linux Foundation und Cisco . Die Initiative basiert auf einem koordinierten Offenlegungsrahmen, bei dem gefundene Schwachstellen verantwortungsvoll an die Softwarehersteller gemeldet werden
.
OpenAIs Daybreak: Daybreak wurde am 11. Mai 2026 angekündigt und ist OpenAIs direkte institutionelle Antwort auf Project Glasswing. Aufbauend auf GPT-5.5 und Codex Security bündelt es drei Modellstufen hinter einem sicherheitsoptimierten Agenten-Framework, das Code-Reviews und Patch-Validierungen in großem Maßstab automatisieren soll. Cisco trat als Gründungspartner des Ökosystems bei, gemeinsam mit Cloudflare, CrowdStrike und Palo Alto Networks .
Die beiden Initiativen repräsentieren eine grundlegende philosophische Spaltung in der KI-Branche. Anthropic argumentierte, dass die Kontrolle des Zugangs zu den gefährlichsten Modellen der beste Weg sei, die globale Cybersicherheit zu stärken. OpenAI hingegen drängte auf einen breiteren, gestaffelten Zugang – auch für Regierungsbehörden auf allen Ebenen – um die Verteidigungslinie mit KI-unterstützten Verteidigern zu fluten .
Ciscos erklärte Motivation war denkbar einfach: KI-gestützte Angriffe sind keine Theorie mehr, und Verteidiger können es sich nicht leisten, in menschlicher Geschwindigkeit zu handeln. Als Anthropic die Zurückhaltung von Claude Mythos Preview bekannt gab, enthüllte das Unternehmen gleichzeitig, dass das Modell bereits Schwachstellen in kritischer Software-Infrastruktur identifiziert hatte, die dem Internet und der breiteren Wirtschaft zugrunde liegt . Die Implikation war eindeutig: Wenn die Verteidiger diese Modelle nicht zuerst einsetzen, würden Gegner irgendwann Zugang zu gleichwertigen Fähigkeiten erhalten.
Cisco stellte das Scannen von 1,8 Milliarden Codezeilen als Wettlauf gegen diese Unausweichlichkeit dar. Das Unternehmen merkte an, dass Frontier-Modelle „Schwachstellen in einem noch nie dagewesenen Ausmaß finden, und es ist keine einmalige Sache. Diese Systeme werden immer wieder neue Schwachstellen finden“ . Durch den Scan seines gesamten Portfolios wollte Cisco Angreifern zuvorkommen, die ähnliche Modelle nutzen könnten, um dieselben Schwachstellen zu identifizieren – aber mit böswilliger Absicht.
Trotz des ganzen Trubels um Geschwindigkeit und Umfang wich Cisco systematisch der wichtigsten Frage aus: Wie viele Schwachstellen haben die Modelle tatsächlich gefunden? Mehrere Berichte bestätigen, dass Cisco sich „weigerte, die Gesamtzahl der gefundenen Schwachstellen preiszugeben“ und weder eine Summe, noch eine Aufschlüsselung nach Schweregrad oder eine Anzahl kritischer oder ausnutzbarer Funde nannte .
Dieses Schweigen wirft ein offensichtliches Glaubwürdigkeitsproblem auf. Hätten die Modelle Tausende schwerwiegender Bugs gefunden, würde die Veröffentlichung dieser Zahl die gesamte Übung validieren – könnte aber auch Kunden und Aufsichtsbehörden alarmieren. Wurden hingegen relativ wenige gefunden, bricht das Argument „acht Wochen versus acht Jahre“ in sich zusammen. Wie auch immer, Cisco entschied sich, die Zahl geheim zu halten und gleichzeitig die „transformative Kraft“ der KI-Scan-Bemühungen zu preisen .
Eine konkrete, umsetzbare Änderung wurde auf der Cisco Live 2026 jedoch angekündigt: Ab Juli verabschiedet sich Cisco von seinem bisherigen Ad-hoc-Modell zur Offenlegung von Sicherheitslücken und wechselt zu einem planbaren, regelmäßigen Ansatz. Das Unternehmen wird seine Sicherheitshinweise künftig am 1. und 3. Mittwoch jedes Monats veröffentlichen, begleitet von einer siebentägigen Vorankündigung, die auflistet, welche Technologien und Plattformen in der jeweiligen Veröffentlichung behandelt werden .
Die Begründung ist direkt mit dem KI-Scan-Programm verknüpft. Das Produktsicherheits-Team (PSIRT) von Cisco rechnet damit, dass die KI-beschleunigte Entdeckung von Schwachstellen das Fundvolumen drastisch erhöhen wird. Ein zweiwöchentlicher Rhythmus ist darauf ausgelegt, Unternehmenskunden die nötige Planbarkeit für ihre Patch-Zyklen zu geben, anstatt dass sie auf überraschende Ad-hoc-Meldungen reagieren müssen . Falls für ein geplantes Veröffentlichungsfenster keine Sicherheitspublikationen vorgesehen sind, wird Cisco dies ebenfalls kommunizieren
.
Während Cisco seine eigene Codebasis durchforstete, evaluierte das britische AI Security Institute (AISI) unabhängig die beiden von Cisco verwendeten Modelle – und die Ergebnisse waren ernüchternd. In einer Reihe von Bewertungen, die zwischen April und Juni 2026 veröffentlicht wurden, stellte das AISI Folgendes fest :
Claude Mythos Preview ist „wesentlich leistungsfähiger im Bereich Cyber-Offensive als jedes Modell, das wir zuvor bewertet haben.“ Die britische Regierung zitierte dieses Ergebnis direkt in einem offenen Brief von Ministerin Liz Kendall und Sicherheitsminister Dan Jarvis vom April 2026 an alle britischen Unternehmensführer und forderte die Vorstände auf, KI-bedingte Cyberrisiken als zentrale Führungsverantwortung zu behandeln . Mythos Preview erreichte eine Erfolgsquote von 73 % bei Capture-the-Flag-Aufgaben (CTF) auf Expertenniveau – eine Premiere für jedes vom Institut bewertete Modell
.
GPT-5.5 absolvierte die 32-stufige AISI-Simulation eines Firmennetzwerkangriffs vollständig von Anfang bis Ende, ein Benchmark, für den das Institut schätzt, dass ein menschlicher Experte etwa 20 Stunden bräuchte. Das Modell erreichte zudem in vielen der 95 eng gefassten CTF-Aufgaben des AISI die Sättigungsgrenze, wodurch grundlegende Benchmarks nicht mehr ausreichen, um das Cyber-Risiko von Frontier-Modellen aussagekräftig zu messen . Bei fortgeschrittenen Aufgaben auf Expertenniveau erreichte GPT-5.5 eine durchschnittliche Erfolgsquote von rund 71 %, verglichen mit etwa 69 % für Mythos Preview und rund 52 % für das Vorgängermodell GPT-5.4
.
Der Gesamttrend beschleunigt sich: Das AISI stellte fest, dass sich die Fähigkeit von KI-Frontier-Modellen, Cyber-Aufgaben autonom zu lösen, nun alle 4,7 Monate verdoppelt, ein deutlicher Rückgang gegenüber dem im November 2025 gemessenen Verdopplungsintervall von 8 Monaten. Sowohl Claude Mythos Preview als auch GPT-5.5 übertrafen diese bereits steilere Trendlinie sogar noch deutlich .
Die Implikationen einer Verdopplungsrate von 4,7 Monaten sind dramatisch. Hält der Trend an, könnten KI-Systeme innerhalb von etwa eineinhalb Jahren autonom Cyber-Aufgaben bewältigen, für die heute Teams aus erfahrenen menschlichen Operatoren Wochen oder Monate benötigen. Das AISI merkte an, dass neuere Versionen beider Modelle die bestehende Suite von 95 Bewertungsaufgaben bereits ausgereizt hätten, was zu „höchst unsicheren Zeithorizonten“ führe, da die Benchmarks das volle Ausmaß der Modellfähigkeiten nicht mehr messen könnten .
Ciscos Ankündigung ergibt zusammen mit den AISI-Bewertungen das Bild einer Branche, die ein KI-getriebenes defensives Wettrüsten akzeptiert hat – und aktiv daran teilnimmt. Dieselben Frontier-Modelle, die 1,8 Milliarden Codezeilen nach Schwachstellen durchsuchen können, können theoretisch von Angreifern genutzt werden, um dieselben Schwachstellen schneller zu finden und auszunutzen, als es jedes menschliche Red Team könnte.
Die Logik von Project Glasswing und Daybreak besteht darin, dass die beste Verteidigung darin liegt, die leistungsfähigsten Modelle zuerst den verantwortungsvollsten Organisationen unter strengen Kontrollen zur Verfügung zu stellen, damit diese kritische Infrastrukturen absichern können, bevor die offensiven Fähigkeiten sich verbreiten. Ciscos Scan von 1,8 Milliarden Codezeilen ist der bislang größte Praxistest dieser These. Die Entscheidung des Unternehmens, die tatsächliche Anzahl der Bugs geheim zu halten, hinterlässt der Branche jedoch einen verführerischen, aber unvollständigen Machbarkeitsnachweis – und einen neuen, KI-getriebenen Offenlegungsrhythmus, der darauf hindeutet, dass das Fundvolumen erheblich genug war, um eine dauerhafte betriebliche Änderung zu erfordern.
Comments
0 comments