Żaden z tych modeli nie był w momencie ogłoszenia dostępny publicznie. Anthropic uznało Claude Mythos Preview za zbyt niebezpieczny do szerokiego udostępnienia właśnie z powodu jego zdolności do ofensywnych cyberoperacji – zamiast tego, przekazano go wyłącznie wyselekcjonowanej grupie partnerów branżowych pod ścisłym nadzorem . OpenAI poszło nieco dalej ze swoim Daybreak, oferując warstwowy dostęp, w tym zamknięty poziom „GPT-5.5-Cyber” zarezerwowany dla zespołów red-team, ale najmocniejsze możliwości wciąż pozostały zastrzeżone dla zweryfikowanych organizacji, takich jak Cisco, CrowdStrike i agencje rządowe
.
Sam system, który to wszystko spinał – Cisco Foundry Security Spec – został przetestowany na sześciu modelach AI, aby zapewnić niezależność od konkretnego dostawcy. Jak ujęło to Cisco: „Model jest akceleratorem; uprząż jest silnikiem” .
Cisco jest członkiem-założycielem obu głównych inicjatyw, które mają wykorzystać potęgę AI do obrony cybernetycznej.
Project Glasswing od Anthropic: Ogłoszony w kwietniu 2026 roku, daje starannie wybranej grupie partnerów dostęp do Claude Mythos Preview na restrykcyjnych warunkach. Celem jest znajdowanie i łatanie luk w krytycznym oprogramowaniu, zanim zrobią to hakerzy. Wśród uczestników są m.in. AWS, Apple, Google, Microsoft, Nvidia, CrowdStrike, Linux Foundation i Cisco . Inicjatywa działa w ramach skoordynowanego systemu ujawniania luk, gdzie znalezione problemy są odpowiedzialnie zgłaszane do twórców oprogramowania
.
Daybreak od OpenAI: Ogłoszony 11 maja 2026 roku jako bezpośrednia odpowiedź na Glasswing. Zbudowany na GPT-5.5 i Codex Security, oferuje trzy poziomy dostępu do modeli w ramach agenta SI zestrojonego pod kątem bezpieczeństwa, który automatyzuje przeglądanie kodu i walidację poprawek na masową skalę. Cisco dołączyło do grona partnerów-założycieli obok Cloudflare, CrowdStrike i Palo Alto Networks .
Te dwie inicjatywy pokazują fundamentalny rozłam w branży AI. Anthropic argumentuje, że kontrolowanie dostępu do najniebezpieczniejszych modeli to najlepszy sposób na poprawę globalnego cyberbezpieczeństwa. OpenAI natomiast naciska na szerszy, choć wciąż warstwowy dostęp – w tym dla agencji rządowych wszystkich szczebli – by zalać pole gry obrońcami wspomaganymi przez AI .
Motywacja Cisco była klarowna: ataki napędzane przez AI przestały być teorią, a obrońcy nie mogą już działać w ludzkim tempie. Gdy Anthropic ogłaszało wstrzymanie Claude Mythos Preview, ujawniło jednocześnie, że model samodzielnie zidentyfikował już słabości w krytycznej infrastrukturze oprogramowania leżącej u podstaw internetu i gospodarki . Przekaz był jasny: jeśli zespoły obronne nie użyją tych modeli jako pierwsze, w końcu zrobią to przeciwnicy.
Cisco nazwało skanowanie 1,8 miliarda linii kodu wyścigiem z tą nieuchronnością. Firma podkreśliła, że modele AI „znajdują luki na skalę, jakiej nigdy wcześniej nie widziano, i to nie jest jednorazowa akcja. Te systemy będą znajdować nowe podatności bez przerwy” .
Mimo fanfar dotyczących szybkości i skali, Cisco systematycznie unikało odpowiedzi na najważniejsze pytanie: ile luk faktycznie odkryto? Wiele raportów potwierdza, że firma „odmówiła ujawnienia całkowitej liczby znalezionych podatności”, nie oferując żadnych danych – ani liczby, ani podziału na stopnie krytyczności, ani informacji, które luki można było wykorzystać .
To milczenie rodzi poważny problem z wiarygodnością. Gdyby modele znalazły tysiące poważnych błędów, ujawnienie tej liczby byłoby fantastyczną walidacją całego przedsięwzięcia – ale mogłoby też zaniepokoić klientów i regulatorów. Jeśli znalazły stosunkowo niewiele, efektowna narracja „osiem lat w osiem tygodni” traci impet. Tak czy inaczej, Cisco woli trzymać tę liczbę w tajemnicy, wychwalając jednocześnie „transformacyjną moc” skanowania AI .
Jedna konkretna zmiana została jednak ogłoszona. Od lipca 2026 roku Cisco rezygnuje z dotychczasowego, doraźnego modelu publikowania luk na rzecz przewidywalnego harmonogramu. Firma będzie teraz publikować biuletyny bezpieczeństwa w pierwszą i trzecią środę każdego miesiąca, a każdą publikację poprzedzi siedmiodniowe powiadomienie z listą technologii i platform, których będzie dotyczyć .
Powód jest bezpośrednio związany z programem skanowania AI. Zespół reagowania na incydenty bezpieczeństwa produktów Cisco (PSIRT) spodziewa się, że przyspieszone przez AI znajdowanie luk radykalnie zwiększy ich liczbę. Dwutygodniowy cykl ma dać klientom korporacyjnym przewidywalność, której potrzebują do planowania aktualizacji, zamiast zmuszać ich do gorączkowego łatania systemów po każdej niespodziewanej publikacji .
Podczas gdy Cisco skanowało swój kod, brytyjski Instytut Bezpieczeństwa AI (AISI) niezależnie testował oba modele. Wnioski były otrzeźwiające :
Claude Mythos Preview jest „znacznie bardziej zdolny do cyberataku niż jakikolwiek model, który wcześniej ocenialiśmy”. Brytyjski rząd powołał się na to wprost w liście od sekretarz stanu Liz Kendall i ministra bezpieczeństwa Dana Jarvisa do liderów biznesu w kwietniu 2026 roku, wzywając zarządy do traktowania ryzyka cybernetycznego związanego z AI jako priorytetu w zarządzaniu . Mythos Preview osiągnął 73% skuteczności w eksperckich zadaniach CTF (capture-the-flag) – jako pierwszy model w historii
.
GPT-5.5 samodzielnie ukończył symulację ataku na sieć korporacyjną opracowaną przez AISI, składającą się z 32 kroków, której wykonanie przez człowieka zajęłoby około 20 godzin. Model ten wyczerpał też możliwości wielu z 95 wąskich zadań cybernetycznych, co oznacza, że podstawowe testy przestały być wystarczające do pomiaru ryzyka .
Ogólny trend przyspiesza: AISI odkryło, że zdolność modeli AI do autonomicznego wykonywania zadań cybernetycznych podwaja się co 4,7 miesiąca, podczas gdy jeszcze w listopadzie 2025 roku wskaźnik ten wynosił 8 miesięcy. Zarówno Claude Mythos Preview, jak i GPT-5.5 znacząco wyprzedziły ten i tak już stromy trend .
Konsekwencje tempa podwajania się co 4,7 miesiąca są szokujące. Jeśli trend się utrzyma, już za około półtora roku systemy AI mogą samodzielnie realizować cyberzadania, które dziś wymagają zespołów ekspertów pracujących tygodniami. AISI zauważyło, że nowsze wersje obu modeli w pełni nasyciły istniejący zestaw 95 testów, przez co horyzonty czasowe stały się wysoce niepewne – testy przestały nadążać za możliwościami modeli .
Ogłoszenie Cisco w połączeniu z wynikami AISI maluje obraz branży, która zaakceptowała i aktywnie uczestniczy w napędzanym AI wyścigu zbrojeń. Te same modele, które mogą przeskanować 1,8 miliarda linii kodu w poszukiwaniu luk, mogą w teorii zostać użyte przez atakujących do znalezienia i wykorzystania tych samych luk szybciej niż jakikolwiek ludzki zespół.
Logika obu programów jest taka, że najlepszą obroną jest przekazanie najpotężniejszych modeli w pierwszej kolejności najbardziej odpowiedzialnym organizacjom, pod ścisłą kontrolą, tak aby mogły załatać infrastrukturę krytyczną, zanim ofensywne możliwości się rozprzestrzenią. Skan Cisco jest największym do tej pory testem tej tezy w warunkach rzeczywistych. Decyzja firmy o zatajeniu liczby błędów sprawia jednak, że reszta branży ma przed sobą kuszący, ale niepełny dowód koncepcji – oraz nowy, napędzany AI harmonogram ujawniania luk, który sugeruje, że ich liczba była na tyle znacząca, by wymusić trwałą zmianę operacyjną.
Comments
0 comments