Специалисты по ИИ из академической среды и индустрии единодушны: требование «нулевого jailbreak» недостижимо при текущем уровне развития технологий . Причины кроются в математической основе работы больших языковых моделей.
Парадокс jailbreak. В статье на arXiv за 2024 год (обновлена в мае 2026 года) формально доказаны два парадокса: во-первых, невозможно построить идеальный классификатор jailbreak, а во-вторых, более слабая модель не может последовательно определять, была ли взломана более сильная модель . Это не ошибка, которую можно исправить — это математическое ограничение, заложенное в самой концепции выравнивания ИИ.
Бесконечная гонка вооружений. Jailbreak — это фундаментально состязательная проблема. Атакующие постоянно находят новые шаблоны запросов, трюки с кодировками и многошаговые стратегии, которые обходят существующие фильтры. Как только один класс взломов закрывают, появляются новые варианты .
Автономное масштабирование взломов. В марте 2026 года журнал Nature Communications опубликовал исследование, показавшее, что большие модели-рассуждатели могут действовать как автономные агенты для взлома, достигая общего показателя успеха 97,14% для всех комбинаций моделей . Атаки становятся всё более изощрёнными и массовыми.
Консенсус экспертов. Специалисты по безопасности утверждают, что полное блокирование возможностей jailbreak «остановило бы всё развёртывание передовых ИИ-моделей» — этот стандарт не цель для исправления ошибок, а абсолютно недостижимый уровень .
Требование «нулевого взлома» не возникло на пустом месте. Ему предшествовал ряд эскалирующих шагов со стороны правительства США в отношении Anthropic:
Конфликт с Пентагоном. Ранее Пентагон признал Anthropic «риском для цепочки поставок» и рекомендовал федеральным агентствам ограничить или прекратить использование продуктов компании .
Сигнал от Amazon. Генеральный директор Amazon Энди Джесси, по сообщениям, предупредил Белый дом о конкретных проблемах безопасности Fable 5, что ускорило вмешательство администрации . Как минимум пять других компаний также подняли тревогу
.
Внезапное отключение. 12 июня в 17:21 по восточному времени Anthropic получила письмо от Минторга. Примерно к 22:00 обе модели были отключены для всех клиентов по всему миру — впервые в истории США применили экспортный контроль к коммерческой ИИ-модели, уже находившейся в открытом доступе .
Ультиматум нулевого взлома. После отключения Белый дом перешёл от ограничений на экспорт к требованию технически невыполнимого стандарта безопасности как условия для будущих релизов .
TechCrunch охарактеризовал всю историю как политический ход, который «никогда не был о взломе ИИ» — сигнал того, что правительство готово в одностороннем порядке решать, когда модель ИИ становится слишком опасной для использования .
Позиция Белого дома, по сообщениям нескольких изданий, состоит в том, что модель Fable 5 может вернуться только в том случае, если компания сделает невозможным любой взлом . Это не просьба о постепенном улучшении или внедрении многоуровневой системы управления уязвимостями — это абсолютное жёсткое требование: либо не существует ни одного jailbreak, либо модель не может быть развёрнута
.
Anthropic в ответ заявила, что «ни один тестировщик до сих пор не смог найти универсальный jailbreak», и что полное предотвращение любых взломов невозможно ни для них, ни для любой другой компании . Компания также отметила, что ей «даже не сообщили о каком-либо конкретном, не универсальном потенциальном взломе, который привёл бы к вредоносному результату»
.
Основываясь на сообщениях многочисленных источников, эксперты выделяют три стратегических пути для Anthropic:
Соблюдение требований и переговоры. 15 июня генеральный директор Дарио Амодеи встретился с представителями Белого дома, чтобы обсудить взаимоприемлемую систему оценки уязвимостей, которая заменила бы абсолютный стандарт «нулевого взлома» многоуровневой системой оценки серьёзности угроз . Белый дом и Anthropic совместно разрабатывают такую систему
. Это путь, по которому компания, по-видимому, движется сейчас.
Судебный или политический вызов. Anthropic может оспорить экспортные ограничения в суде, утверждая, что правительство превысило свои полномочия или нарушило процессуальные нормы, применив экспортный контроль задним числом к уже доступному публично коммерческому продукту . Это был бы шаг с высокими рисками, который мог бы создать прецедентное право.
Реструктуризация или перенос операций. Anthropic может ограничить выпуск моделей юрисдикциями с более предсказуемой нормативной средой или изменить корпоративную структуру, разделив продукты для рынка США и для мирового рынка. Некоторые аналитики называют это «ядерным вариантом», который коренным образом изменит бизнес-модель компании.
Этот конфликт высветил три фундаментальных противоречия, которые определят будущее передового искусственного интеллекта:
Техническая реальность против нормативного абсолютизма. Правительство требует гарантии — нулевого jailbreak — которая, как утверждает наука о компьютерах, недостижима . Если администрация будет настаивать на этом стандарте, она фактически получит право вето на выпуск любой передовой модели, поскольку ни одна лаборатория не сможет выполнить это условие.
Экспортный контроль на публичное программное обеспечение. Впервые США применили экспортные ограничения к коммерческой ИИ-модели, которая уже была в открытом доступе . Это создаёт прецедент: любую ИИ-лабораторию можно заставить отключить свой продукт в одночасье на основании одностороннего решения о национальной безопасности.
Независимость против фактического надзора. Anthropic была основана с миссией, ориентированной на безопасность и независимость. Действия Белого дома показывают: даже самые «ответственные» лаборатории могут быть принуждены к соблюдению технически нереалистичных государственных стандартов — или их продукты будут просто выключены . Как выразился Bloomberg, блокировка знаменует собой «разворот США» и «предупреждение Кремниевой долине» о том, что эра саморегулируемого развёртывания передовых ИИ-моделей, возможно, подошла к концу
.
Comments
0 comments