Cloudflare тестировала модель на разных частях своей инфраструктуры — включая runtime‑системы, сетевые протоколы, компоненты control plane и open‑source проекты.
Ещё одна заметная возможность — автоматическая генерация proof‑of‑concept кода.
Во время тестов модель могла:
Таким образом Mythos фактически выполнял итерационный цикл разработки эксплойта, который обычно требует участия человека.
Для специалистов по безопасности PoC — важный этап: именно он показывает, можно ли реально использовать найденный баг. Если этот этап автоматизировать, процесс проверки и приоритизации уязвимостей может значительно ускориться.
По данным Anthropic, в ходе внутренних тестов модель демонстрировала и другие способности:
Это говорит о том, что Mythos ориентирован не столько на обычное программирование, сколько на структурный анализ уязвимостей и логику эксплуатации ошибок.
Несмотря на впечатляющие возможности, тестирование выявило и проблемы.
Модель иногда сообщала о уязвимостях, которые на практике не были эксплуатируемыми. Особенно часто это происходило в проектах на языках с небезопасной работой с памятью, например C и C++.
Это означает, что даже при использовании подобных моделей человеческая проверка остаётся обязательной.
Cloudflare также заметила неравномерную работу защитных ограничений. В некоторых случаях модель находила путь атаки, но затем отказывалась демонстрировать эксплойт из‑за встроенных ограничений. В других случаях она успевала продвинуться дальше перед остановкой.
Такая непоследовательность показывает, насколько сложно балансировать между полезностью для исследований и предотвращением злоупотреблений.
Результаты эксперимента показывают, что роль ИИ в поиске уязвимостей быстро меняется.
Для защитников подобные системы могут:
Но те же возможности несут и риск. Если ИИ способен сам переходить от обнаружения бага к рабочему эксплойту, барьер для создания сложных кибератак может значительно снизиться.
Cloudflare в своих выводах отмечает: просто ускорить установку патчей уже недостаточно. В эпоху ИИ‑ускоренного поиска уязвимостей организациям, возможно, придётся менять саму архитектуру управления безопасностью.
Claude Mythos Preview демонстрирует классическую проблему технологий двойного назначения (dual‑use).
С одной стороны:
С другой:
Именно поэтому модель пока не выпускается публично. Она доступна ограниченному числу организаций для оборонительных исследований в рамках программы Project Glasswing.
Тесты Cloudflare показывают важный рубеж: ИИ постепенно переходит от роли помощника программиста к инструменту, который способен полностью анализировать уязвимости и строить сценарии их эксплуатации. И это может серьёзно изменить баланс сил в кибербезопасности в ближайшие годы.
Comments
0 comments