Geen van beide modellen was beschikbaar voor het grote publiek op het moment van Cisco's aankondiging. Anthropic had Claude Mythos Preview te gevaarlijk geacht voor onbeperkte release, juist vanwege de offensieve cybercapaciteiten. In plaats daarvan gaven ze het model alleen aan een zorgvuldig uitgekozen consortium van industriepartners onder streng toezicht . OpenAI's aanpak met Daybreak was iets breder: met gelaagde toegangsniveaus, waaronder een afgeschermde "GPT-5.5-Cyber"-laag die exclusief is voorbehouden aan red-teamgebruik. De meest krachtige mogelijkheden bleven echter beperkt tot doorgelichte organisaties zoals Cisco, CrowdStrike en overheidsinstanties
.
Cisco's interne framework voor deze modellen, de Cisco Foundry Security Spec, werd getest op zes frontier AI-modellen om ervoor te zorgen dat het model-onafhankelijk kon werken. In Cisco's eigen woorden: "Het model is de aanjager; het framework is de motor" .
Cisco is een van de oprichtende charter-leden van beide grote industriële initiatieven om frontier-AI in te zetten voor defensieve cyberbeveiliging.
Anthropic's Project Glasswing: Dit project ging in april 2026 van start en geeft een zorgvuldig geselecteerde groep partners toegang tot Claude Mythos Preview onder strikte voorwaarden. Het doel is om kwetsbaarheden in kritieke software te vinden en te patchen voordat aanvallers ze kunnen misbruiken. Tot de charter-deelnemers behoren AWS, Apple, Google, Microsoft, Nvidia, CrowdStrike, de Linux Foundation en Cisco . Het initiatief werkt via een gecoördineerd openbaarmakingskader waarbij gevonden kwetsbaarheden op verantwoorde wijze worden gerapporteerd aan de software-onderhouders
.
OpenAI's Daybreak: Aangekondigd op 11 mei 2026 is Daybreak OpenAI's directe institutionele antwoord op Project Glasswing. Gebouwd op GPT-5.5 en Codex Security bundelt het drie modelniveaus achter een op beveiliging afgestemd agent-framework dat is ontworpen voor het automatiseren van code-review en patch-validatie op grote schaal. Cisco sloot zich aan als charter-ecosysteempartner naast Cloudflare, CrowdStrike en Palo Alto Networks .
De twee initiatieven vertegenwoordigen een fundamentele filosofische splitsing in de AI-industrie. Anthropic heeft betoogd dat het controleren van de toegang tot de gevaarlijkste modellen de beste manier is om de wereldwijde cyberveiligheid te vergroten, terwijl OpenAI pleit voor bredere, gelaagde toegang—ook voor overheidsinstanties op alle niveaus—om de zone te overspoelen met AI-geassisteerde verdedigers .
De motivatie van Cisco was rechtlijnig: AI-aangedreven aanvallen zijn niet langer theoretisch en verdedigers kunnen het zich niet veroorloven om op menselijke snelheid te bewegen. Toen Anthropic aankondigde Claude Mythos Preview achter te houden, onthulde het tegelijkertijd dat het model al zwakke plekken had geïdentificeerd in de kritieke software-infrastructuur die ten grondslag ligt aan het internet en de bredere economie . De implicatie was duidelijk: als defensieve teams deze modellen niet als eerste gebruiken, krijgen tegenstanders uiteindelijk toegang tot vergelijkbare capaciteiten.
Cisco schetste de scan van 1,8 miljard regels code als een race tegen die onvermijdelijkheid. Het bedrijf merkte op dat frontier-modellen "kwetsbaarheden vinden op een schaal die nooit eerder is bereikt, en het is geen eenmalige actie. Deze dingen zullen nieuwe kwetsbaarheden blijven vinden" . Door de scan uit te voeren over zijn volledige portfolio, wilde Cisco aanvallers voor zijn die soortgelijke modellen zouden kunnen gebruiken om dezelfde zwakke plekken te identificeren—maar dan met kwade bedoelingen.
Ondanks de fanfare over snelheid en schaal vermeed Cisco systematisch het antwoord op de allerbelangrijkste vraag: hoeveel kwetsbaarheden hebben de modellen daadwerkelijk gevonden? Meerdere rapporten bevestigen dat Cisco "weigerde het totale aantal gevonden kwetsbaarheden bekend te maken" en geen enkele telling, uitsplitsing naar ernst of aantal kritieke of exploiteerbare bevindingen gaf .
Deze stilte creëert een overduidelijk geloofwaardigheidsprobleem. Als de modellen duizenden ernstige bugs hadden gevonden, zou het openbaar maken van dat aantal de hele oefening valideren—maar het zou ook klanten en toezichthouders kunnen alarmeren. Als ze er relatief weinig vonden, stort het verhaal van 'acht weken versus acht jaar' in elkaar. Hoe dan ook koos Cisco ervoor om het aantal geheim te houden terwijl het de "transformerende kracht" van de AI-scanprees .
Eén concrete, uitvoerbare verandering kwam wél naar voren tijdens Cisco Live 2026: vanaf juli verlaat Cisco zijn oude ad-hocmodel voor het melden van kwetsbaarheden ten gunste van een voorspelbare, geplande aanpak. Het bedrijf zal nu beveiligingsadviezen publiceren op de 1e en 3e woensdag van elke maand, vergezeld van een aankondiging zeven dagen van tevoren waarin staat vermeld welke technologieën en platforms in elke release aan bod zullen komen .
De reden hierachter is direct gekoppeld aan het AI-scanprogramma. Cisco's Product Security Incident Response Team (PSIRT) verwacht dat de door AI versnelde ontdekking van kwetsbaarheden het aantal bevindingen drastisch zal verhogen. Een tweewekelijkse cyclus is ontworpen om zakelijke klanten de voorspelbaarheid te geven die ze nodig hebben om patch-cycli te plannen, in plaats van dat ze moeten haasten om te reageren op verrassingsadviezen . Als er geen beveiligingspublicaties gepland zijn voor een bepaald venster, zal Cisco dat ook communiceren
.
Terwijl Cisco zijn eigen codebase scande, evalueerde het Britse AI Security Institute (AISI) onafhankelijk de twee modellen die Cisco gebruikte—en de bevindingen waren ontnuchterend. In een reeks evaluaties die tussen april en juni 2026 werden gepubliceerd, ontdekte het AISI het volgende :
Claude Mythos Preview is "aanzienlijk bedrevener in offensieve cyberaanvallen dan enig model dat we eerder hebben beoordeeld." De Britse regering citeerde deze bevinding rechtstreeks in een open brief van minister Liz Kendall en veiligheidsminister Dan Jarvis aan alle Britse bedrijfsleiders in april 2026, waarin besturen werden aangespoord om AI-versterkt cyberrisico als een bestuurlijke verantwoordelijkheid van de eerste orde te behandelen . Mythos Preview behaalde een slagingspercentage van 73% op geavanceerde capture-the-flag (CTF)-taken—een primeur voor elk model dat het instituut heeft geëvalueerd
.
GPT-5.5 voltooide de 32-stappen tellende bedrijfsnetwerkaanvalsimulatie van het AISI van begin tot eind, een benchmark die volgens het instituut een menselijke expert ongeveer 20 uur zou kosten. Het model verzadigde ook veel van de 95 smalle capture-the-flag-cybertaken van het AISI, waardoor basisbenchmarks onvoldoende werden om het cyberrisico van frontier-modellen zinvol te meten . Op geavanceerde taken op expertniveau behaalde GPT-5.5 een gemiddeld slagingspercentage van ongeveer 71%, vergeleken met circa 69% voor Mythos Preview en ongeveer 52% voor de vorige generatie GPT-5.4
.
De algehele trend versnelt: Het AISI ontdekte dat de capaciteit van frontier AI-modellen om autonoom cyber-taken te voltooien nu elke 4,7 maanden verdubbelt, een forse daling ten opzichte van het verdubbelingsinterval van 8 maanden dat het instituut in november 2025 rapporteerde. Zowel Claude Mythos Preview als GPT-5.5 overtroffen zelfs deze versnelde trendlijn ruimschoots .
De implicaties van een verdubbeling elke 4,7 maanden zijn grimmig. Als de trend aanhoudt, kunnen AI-systemen binnen ongeveer anderhalf jaar autonoom cyber-taken voltooien waarvoor vandaag de dag teams van deskundige menselijke operators weken of maanden nodig hebben. Het AISI merkte op dat nieuwere checkpoints van beide modellen de bestaande evaluatieset van 95 taken al hadden verzadigd, wat "zeer onzekere tijdshorizons" opleverde omdat de benchmarks de volledige omvang van de capaciteiten van de modellen niet langer konden meten .
Cisco's aankondiging, in combinatie met de AISI-evaluaties, schetst een beeld van een industrie die een door AI aangewakkerde defensieve wapenwedloop heeft geaccepteerd—en er actief aan deelneemt. Dezelfde frontier-modellen die 1,8 miljard regels code kunnen scannen op kwetsbaarheden, kunnen in theorie door aanvallers worden gebruikt om diezelfde kwetsbaarheden sneller te vinden en te misbruiken dan enig menselijk red team.
De logica van zowel Project Glasswing als Daybreak is dat de beste verdediging eruit bestaat om de meest capabele modellen het eerst aan de meest verantwoordelijke organisaties te geven, onder strenge controle, zodat zij kritieke infrastructuur kunnen patchen voordat de offensieve capaciteiten zich verspreiden. Cisco's scan van 1,8 miljard regels code is de grootste praktijktest van die stelling tot nu toe. De beslissing van het bedrijf om het daadwerkelijke aantal bugs achter te houden, laat de rest van de industrie echter zitten met een aanlokkelijk maar onvolledig proof-of-concept—en een nieuwe, door AI gedreven meldingsfrequentie die suggereert dat het volume aan bevindingen aanzienlijk genoeg was om een permanente operationele verandering te rechtvaardigen.
Comments
0 comments