Несмотря на впечатляющие результаты в поиске уязвимостей, Mythos пока плохо подходит для некоторых ключевых этапов работы специалистов по безопасности.
В частности:
Сообщения о «тысячах критических уязвимостей», найденных Mythos, в основном исходят из материалов Anthropic или связанных источников. Пока такие цифры стоит рассматривать как заявления производителя, пока их не подтвердят независимые воспроизводимые исследования .
Интересно, что государственные тесты не показывают явного доминирования Mythos над другими передовыми моделями.
AISI отмечает, что Mythos стал первым, кто выполнил сложную симуляцию сетевой атаки, но вскоре GPT‑5.5 достиг сопоставимого уровня результатов в той же серии кибериспытаний .
Некоторые сторонние отчёты указывают, что GPT‑5.5 показал похожую эффективность в задачах высокой сложности. Например, сообщалось о примерно сопоставимых показателях успешности на «экспертных» заданиях в тестах института, хотя эти данные требуют осторожной интерпретации до публикации полного набора результатов .
Компания XBOW, разрабатывающая AI‑инструменты для безопасности, также утверждает, что в её внутренних тестах с реальными историческими уязвимостями GPT‑5.5 демонстрирует «Mythos‑подобные» возможности взлома при анализе и эксплуатации багов .
С точки зрения практического применения это означает, что преимущество Mythos может зависеть не столько от самой модели, сколько от:
Появление таких моделей вызывает заметную реакцию со стороны государств и финансового сектора.
Например:
Некоторые правительства уже начали специальные проверки и рабочие группы, чтобы оценить риски, связанные с подобными системами.
По данным AISI, возможности AI в киберзадачах растут очень быстро: длина сложных задач, которые модели способны выполнять автономно, удваивается каждые несколько месяцев в их тестовой среде .
Британский Национальный центр кибербезопасности (NCSC) предупреждает, что передовые модели уже помогают в отдельных этапах кибератак — например:
Это создаёт своеобразную гонку вооружений. Защитники хотят использовать такие системы, чтобы быстрее находить и исправлять ошибки, а регуляторы опасаются, что те же технологии могут снизить стоимость и сложность кибератак.
Самое точное описание Mythos сегодня — это высокоэффективный помощник по кибербезопасности с двойным назначением.
Он действительно ускоряет поиск уязвимостей и сложные эксперименты с атаками, но пока:
Главные открытые вопросы — это уровень ложных срабатываний, подтверждаемость результатов вне лабораторных тестов и то, смогут ли конкурирующие системы достигать похожих возможностей дешевле.
Comments
0 comments