На момент оголошення жодна з моделей не була доступна широкому загалу. Anthropic визнала Claude Mythos Preview занадто небезпечною для необмеженого релізу саме через її наступальні кіберможливості, надавши її лише обраному консорціуму галузевих партнерів під суворим наглядом . Підхід OpenAI з Daybreak був дещо ширшим — компанія запропонувала багаторівневий доступ, включаючи закритий рівень «GPT-5.5-Cyber», призначений виключно для команд «червоних» (red team). Однак найпотужніші можливості залишилися доступними лише для перевірених організацій, таких як Cisco, CrowdStrike та державні установи
.
Внутрішній «двигун» Cisco для цих моделей, названий Cisco Foundry Security Spec, пройшов тестування на шести frontier-моделях, щоб забезпечити незалежність від конкретної моделі. Як заявляють у самій компанії: «Модель — це прискорювач; двигун — це платформа» .
Cisco є одним із засновників обох великих галузевих ініціатив, спрямованих на використання frontier-ШІ для оборонної кібербезпеки.
Project Glasswing від Anthropic: Запущений у квітні 2026 року, Project Glasswing надає ретельно відібраній групі партнерів доступ до Claude Mythos Preview на суворих умовах. Мета — знаходити та виправляти вразливості в критичному програмному забезпеченні до того, як ними зможуть скористатися зловмисники. Серед статутних учасників — AWS, Apple, Google, Microsoft, Nvidia, CrowdStrike, Linux Foundation та Cisco . Ініціатива діє через структуру скоординованого розкриття, коли знайдені вразливості відповідально передаються розробникам програмного забезпечення
.
Daybreak від OpenAI: Анонсований 11 травня 2026 року, Daybreak є прямою інституційною відповіддю OpenAI на Project Glasswing. Побудований на GPT-5.5 та Codex Security, він об'єднує три рівні моделей у межах агентної системи, налаштованої на безпеку, для автоматизації перевірки коду та валідації патчів у великих масштабах. Cisco приєдналася як статутний партнер екосистеми поряд із Cloudflare, CrowdStrike та Palo Alto Networks .
Ці дві ініціативи відображають фундаментальний філософський розкол в індустрії ШІ. Anthropic стверджує, що контроль доступу до найнебезпечніших моделей — це найкращий спосіб підвищити глобальну кібербезпеку, тоді як OpenAI виступає за ширший, багаторівневий доступ, в тому числі для державних установ усіх рівнів, щоб забезпечити максимальну кількість захисників, озброєних ШІ .
Мотивація Cisco була гранично чіткою: атаки з використанням ШІ вже не теорія, і захисники не можуть дозволити собі рухатися з людською швидкістю. Коли Anthropic оголосила, що утримує Claude Mythos Preview, вона одночасно повідомила, що модель вже виявила слабкі місця в критичній програмній інфраструктурі, що лежить в основі інтернету та економіки . Висновок очевидний: якщо команди захисту не використовуватимуть ці моделі першими, зловмисники зрештою отримають доступ до еквівалентних можливостей.
Cisco представила сканування 1,8 млрд рядків коду як перегони з цією неминучістю. У компанії зазначили, що frontier-моделі «знаходять вразливості в масштабах, яких ніколи не було раніше, і це не разова акція. Ці системи продовжуватимуть знаходити нові вразливості» . Запустивши сканування всього свого портфоліо, Cisco прагнула випередити атакуючих, які можуть використовувати аналогічні моделі для виявлення тих самих слабких місць, але зі зловмисними намірами.
Незважаючи на фанфари щодо швидкості та масштабу, Cisco систематично уникала відповіді на найважливіше питання: скільки вразливостей насправді знайшли моделі? Численні звіти підтверджують, що Cisco «відмовилася розкрити загальну кількість вразливостей», не надавши жодних даних, розбивки за серйозністю чи кількості критичних знахідок .
Це мовчання створює очевидну проблему довіри. Якби моделі знайшли тисячі серйозних помилок, оприлюднення цієї цифри підтвердило б цінність усієї вправи, але могло б також стривожити клієнтів та регуляторів. Якщо ж знахідок було відносно мало, то гучна заява про «вісім років за вісім тижнів» втрачає сенс. У будь-якому випадку, Cisco вирішила залишити цифру в секреті, вихваляючи при цьому «трансформаційну силу» сканування за допомогою ШІ .
Одна конкретна, дієва зміна на Cisco Live 2026 таки відбулася: починаючи з липня, Cisco відмовляється від своєї попередньої ad-hoc моделі розкриття вразливостей на користь передбачуваного, регулярного підходу. Тепер компанія публікуватиме бюлетені безпеки кожної 1-ї та 3-ї середи місяця із семиденним попереднім повідомленням про те, які технології та платформи будуть охоплені в кожному випуску .
Це рішення безпосередньо пов'язане з програмою сканування за допомогою ШІ. Команда реагування на інциденти безпеки продуктів Cisco (PSIRT) очікує, що прискорене ШІ виявлення вразливостей різко збільшить обсяг знахідок, а регулярний графік двічі на місяць має на меті дати корпоративним клієнтам передбачуваність, необхідну для планування циклів оновлення, замість того, щоб гарячково реагувати на несподівані сповіщення . Якщо публікацій з безпеки на певний день не заплановано, Cisco також повідомлятиме про це
.
Поки Cisco сканувала власну кодову базу, Інститут безпеки ШІ Великої Британії (AISI) незалежно оцінював дві моделі, які використовувала компанія, і результати були тверезими. У серії оцінок, опублікованих між квітнем та червнем 2026 року, AISI виявив :
Claude Mythos Preview є «суттєво більш здатною до кібернападу, ніж будь-яка модель, яку ми оцінювали раніше». Британський уряд прямо послався на цей висновок у відкритому листі до всіх бізнес-лідерів Великої Британії від держсекретаря Ліз Кендалл та міністра безпеки Дена Джарвіса у квітні 2026 року, закликаючи ради директорів ставитися до кіберризиків, посилених ШІ, як до першочергової управлінської відповідальності . Mythos Preview досягла 73% успішності на завданнях експертного рівня з «захоплення прапора» (CTF) — вперше для будь-якої моделі, оціненої інститутом
.
GPT-5.5 повністю виконала 32-крокову симуляцію атаки на корпоративну мережу від AISI — еталон, який, за оцінками інституту, зайняв би в людини-експерта близько 20 годин. Модель також вичерпала багато з 95 вузьких кіберзавдань AISI у форматі CTF, що зробило базові тести недостатніми для змістовного вимірювання кіберризику від frontier-моделей . На просунутих завданнях експертного рівня GPT-5.5 досягла середнього рівня успішності близько 71% порівняно з приблизно 69% для Mythos Preview і близько 52% для попереднього покоління GPT-5.4
.
Загальна тенденція прискорюється: AISI виявив, що здатність frontier-моделей ШІ автономно виконувати кіберзавдання тепер подвоюється кожні 4,7 місяця, що значно менше за 8-місячний інтервал подвоєння, зафіксований інститутом у листопаді 2025 року. І Claude Mythos Preview, і GPT-5.5 суттєво перевищили навіть цю крутішу лінію тренду .
Наслідки подвоєння кожні 4,7 місяця є разючими. Якщо тенденція збережеться, приблизно через півтора року системи ШІ зможуть автономно виконувати кіберзавдання, на які сьогодні потрібні команди експертів-людей, що працюють тижнями або місяцями. AISI зазначив, що новіші версії обох моделей вже повністю вичерпали існуючий набір із 95 оціночних завдань, що призвело до «дуже невизначених часових горизонтів», оскільки еталонні тести більше не можуть виміряти повний обсяг можливостей моделей .
Заява Cisco, разом з оцінками AISI, малює картину індустрії, яка прийняла і активно бере участь у перегонах оборонних озброєнь, що підживлюються ШІ. Ті самі frontier-моделі, які можуть просканувати 1,8 млрд рядків коду на наявність вразливостей, теоретично можуть бути використані зловмисниками для пошуку та використання тих самих вразливостей швидше, ніж будь-яка людська команда.
Логіка як Project Glasswing, так і Daybreak полягає в тому, що найкращий захист — це надати найздібніші моделі найвідповідальнішим організаціям першими, під суворим контролем, щоб вони могли «залатати» критичну інфраструктуру до того, як наступальні можливості поширяться. Сканування Cisco 1,8 млрд рядків коду є найбільшим реальним випробуванням цієї тези на сьогодні. Однак рішення компанії приховати реальну кількість помилок залишає решту індустрії з інтригуючим, але неповним доказом концепції — і новим, керованим ШІ графіком розкриття інформації, який свідчить про те, що обсяг знахідок був достатньо значним, щоб вимагати постійних операційних змін.
Comments
0 comments