Ingen av modellene var offentlig tilgjengelige da Cisco kunngjorde resultatene. Anthropic hadde vurdert Claude Mythos Preview som for farlig for allmenn lansering, nettopp på grunn av dens offensive cyberevner, og valgte å kun gi tilgang til et håndplukket konsortium av industripartnere under strengt oppsyn . OpenAIs tilnærming med Daybreak var noe bredere – de tilbød nivådelt tilgang, inkludert et avlukket "GPT-5.5-Cyber"-nivå kun for "red team"-bruk – men de kraftigste funksjonene forble reservert for godkjente organisasjoner som Cisco, CrowdStrike og offentlige etater
.
Ciscos interne rammeverk for disse modellene, kalt Cisco Foundry Security Spec, ble testet på tvers av seks banebrytende AI-modeller for å sikre at det var modell-uavhengig. Som Cisco selv formulerte det: "Modellen er bensin på bålet; rammeverket er motoren" .
Cisco er et grunnleggende chartermedlem i begge de store industriinitiativene for å ta i bruk avansert AI til defensiv cybersikkerhet.
Anthropics Project Glasswing: Dette prosjektet ble lansert i april 2026 og gir en nøye utvalgt gruppe partnere tilgang til Claude Mythos Preview under strenge betingelser. Målet er å finne og tette sårbarheter i kritisk programvare før angripere kan utnytte dem. Deltakerne i charteret inkluderer AWS, Apple, Google, Microsoft, Nvidia, CrowdStrike, Linux Foundation og Cisco . Initiativet opererer gjennom et koordinert rammeverk for ansvarlig avsløring, der identifiserte sårbarheter rapporteres til programvarevedlikeholderne
.
OpenAIs Daybreak: Kunngjort 11. mai 2026, er Daybreak OpenAIs direkte institusjonelle motsvar til Project Glasswing. Bygget på GPT-5.5 og Codex Security, samler det tre modellnivåer bak et sikkerhetstilpasset agentrammeverk designet for å automatisere kodegjennomgang og validering av programvarefikser i stor skala. Cisco sluttet seg til som charter-økosystempartner sammen med Cloudflare, CrowdStrike og Palo Alto Networks .
De to initiativene representerer en grunnleggende filosofisk splittelse i AI-industrien. Anthropic har argumentert for at kontroll med tilgangen til de farligste modellene er den beste måten å styrke global cybersikkerhet på, mens OpenAI har presset for bredere, nivådelt tilgang – inkludert til offentlige etater – for å oversvømme sonen med AI-assisterte forsvarere .
Ciscos uttalte motivasjon var enkel: AI-drevne angrep er ikke lenger teoretiske, og forsvarerne har ikke råd til å bevege seg i menneskelig tempo. Da Anthropic kunngjorde at de holdt tilbake Claude Mythos Preview, avslørte de samtidig at modellen allerede hadde identifisert svakheter i kritisk programvareinfrastruktur som Internett og økonomien for øvrig er avhengige av . Implikasjonen var klar: Hvis defensive team ikke bruker disse modellene først, vil motstandere før eller siden få tilgang til tilsvarende kapasiteter.
Cisco fremstilte skanningen av 1,8 milliarder linjer som et kappløp mot denne uunngåeligheten. Selskapet bemerket at slike modeller «finner sårbarheter i en skala som aldri før er oppnådd, og det er ingen engangsforeteelse. Disse tingene kommer til å fortsette å finne nye sårbarheter» . Ved å kjøre skanningen over hele porteføljen sin, hadde Cisco som mål å komme i forkjøpet av angripere som kunne bruke lignende modeller til å identifisere de samme svakhetene – men med ondsinnet hensikt.
Til tross for fanfaren rundt fart og skala, unngikk Cisco systematisk å svare på det viktigste spørsmålet: Hvor mange sårbarheter fant modellene faktisk? Flere rapporter bekrefter at Cisco «nektet å oppgi det totale antallet sårbarheter» som ble oppdaget, og ga verken noen opptelling, alvorlighetsgradfordeling eller antall kritiske eller utnyttbare funn .
Denne stillheten skaper et åpenbart troverdighetsproblem. Hvis modellene fant tusenvis av alvorlige feil, ville en offentliggjøring av dette tallet validert hele øvelsen – men det kunne også skremt kunder og reguleringsmyndigheter. Hvis de fant relativt få, kollapser premisset om åtte uker versus åtte år. Uansett utfall valgte Cisco å holde tallet hemmelig, samtidig som de hyllet den «transformative kraften» til AI-skanningen .
Én konkret og handlingsrettet endring kom likevel ut av Cisco Live 2026: Fra og med juli forlater Cisco sin tidligere ad-hoc-modell for sårbarhetsvarsling til fordel for en forutsigbar, planlagt tilnærming. Selskapet vil nå publisere sikkerhetsbulletiner på den 1. og 3. onsdagen i hver måned, ledsaget av et syv dagers forhåndsvarsel som ramser opp hvilke teknologier og plattformer den enkelte oppdateringen vil dekke .
Begrunnelsen er direkte knyttet til AI-skanningen. Ciscos Product Security Incident Response Team (PSIRT) forventer at den AI-akselererte oppdagelsen av sårbarheter vil øke volumet av funn dramatisk. En halvmånedlig publiseringsplan er designet for å gi bedriftskunder den forutsigbarheten de trenger for å planlegge oppdateringssykluser, i stedet for å måtte hastebehandle overraskende varsler . Hvis det ikke er noen sikkerhetspublikasjoner planlagt for en gitt publiseringsdato, vil Cisco også kommunisere dette
.
Mens Cisco skannet sin egen kodebase, evaluerte Storbritannias AI Security Institute (AISI) uavhengig de to modellene Cisco brukte – og funnene var nøkterne. I en serie evalueringer publisert mellom april og juni 2026 fant AISI :
Claude Mythos Preview er «vesentlig dyktigere til cyberangrep enn noen modell vi tidligere har vurdert.» Den britiske regjeringen siterte dette funnet direkte i et åpent brev i april 2026 fra statsråd Liz Kendall og sikkerhetsminister Dan Jarvis til alle britiske næringslivsledere, der de ba styrer om å behandle AI-forsterket cyberrisiko som et ansvar på styrenivå . Mythos Preview oppnådde en suksessrate på 73 prosent på ekspertnivå-oppgaver innen "capture-the-flag" (CTF) – en første gang for noen modell instituttet har evaluert
.
GPT-5.5 fullførte AISIs 32-trinns simulering av bedriftsnettverksangrep ende-til-ende, en benchmark instituttet anslår ville tatt en menneskelig ekspert rundt 20 timer. Modellen nådde også taket på mange av AISIs serie på 95 avgrensede CTF-oppgaver, noe som gjorde enkle målemetoder utilstrekkelige for å meningsfullt vurdere risikoen ved slike modeller . På avanserte ekspertnivå-oppgaver oppnådde GPT-5.5 en gjennomsnittlig beståelsesrate på rundt 71 prosent, sammenlignet med omtrent 69 prosent for Mythos Preview og rundt 52 prosent for forrige generasjons GPT-5.4
.
Den generelle trenden akselererer: AISI fant at avanserte AI-modellers evne til å fullføre cyberoppgaver autonomt nå dobles hver 4,7. måned, en kraftig nedgang fra et doblingsintervall på åtte måneder instituttet registrerte i november 2025. Både Claude Mythos Preview og GPT-5.5 lå betydelig over denne allerede bratte trendlinjen .
Implikasjonene av en doblingsrate på 4,7 måneder er grelle. Hvis trenden holder, kan AI-systemer i løpet av omtrent halvannet år autonomt fullføre cyberoppgaver som i dag krever team av eksperter som jobber i uker eller måneder. AISI bemerket at nyere versjoner av begge modellene allerede hadde nådd taket på den eksisterende evalueringsserien på 95 oppgaver, noe som ga «svært usikre tidshorisonter» fordi målemetodene ikke lenger kunne fange opp den fulle bredden av modellenes kapasiteter .
Ciscos kunngjøring, sett i sammenheng med AISI-evalueringene, tegner et bilde av en industri som har akseptert – og aktivt deltar i – et AI-drevet defensivt våpenkappløp. De samme avanserte modellene som kan skanne 1,8 milliarder kodelinjer for sårbarheter, kan i teorien brukes av angripere til å finne og utnytte de samme sårbarhetene raskere enn noe menneskelig "red team".
Logikken bak både Project Glasswing og Daybreak er at det beste forsvaret er å gi de mest kapable modellene til de mest ansvarlige organisasjonene først, under streng kontroll, slik at de kan tette hull i kritisk infrastruktur før de offensive kapasitetene sprer seg. Ciscos skanning av 1,8 milliarder linjer er den største virkelige testen av denne tesen til dags dato. Selskapets beslutning om å holde tilbake det faktiske antallet feil, etterlater imidlertid resten av bransjen med et forlokkende, men ufullstendig konseptbevis – og en ny, AI-drevet varslingsrytme som tyder på at volumet av funn var betydelig nok til å kreve en permanent operativ endring.
Comments
0 comments