Ограничения затронули не только кибербезопасность. Предохранители также срабатывают на запросы, связанные с биологией, химией и, что критически важно, дистилляцией моделей ИИ. Последний пункт вызвал отдельную волну возмущения: разработчики обвинили Anthropic в использовании «безопасности» как предлога для неконкурентного поведения, чтобы помешать другим ИИ-компаниям обучаться на ответах Fable 5 .
Система безопасности Fable 5 — это не простой блокировщик, а механизм скрытой маршрутизации . Архитектура состоит из трех шагов:
Anthropic утверждает, что такие срабатывания происходят в среднем менее чем в 5% сессий . Компания публично признала проблему гиперчувствительности. Представитель Anthropic сообщил Business Insider, что меры безопасности «могут помечать безопасные, нейтральные или безобидные запросы», но оправдал это как необходимый компромисс для того, чтобы вообще выпустить в свет модель с такой мощной внутренней «начинкой»
.
Позиция Anthropic такова: консервативные предохранители — это осознанный и ответственный выбор, а не ошибка. Компания настаивает, что лежащая в основе архитектура класса Mythos настолько искусна в поиске и эксплуатации программных уязвимостей, что ее бесконтрольный выпуск создал бы неприемлемый риск катастрофического злоупотребления .
В их понимании, ограничения — это конструктивный компромисс: способ дать публике доступ к передовым возможностям анализа, программирования и работы с текстом, поместив «песочницу» вокруг самых опасных способностей. Они называют чрезмерную фильтрацию временной платой за быстрый и безопасный релиз , обещая со временем доработать классификаторы.
Релиз Claude Fable 5 нельзя рассматривать в отрыве от его «близнеца». Это часть новой двухуровневой стратегии развертывания, которая становится индустриальным стандартом для передовых моделей ИИ .
В один день с Fable 5 Anthropic анонсировала и Claude Mythos 5. Обе модели имеют идентичную архитектуру и веса — это один и тот же «мозг». Разница лишь в конфигурации безопасности: у Mythos 5 классификаторы в чувствительных областях отключены, давая полный доступ ко всем возможностям .
Но Mythos 5 — не для всех. Доступ к нему строго ограничен узким кругом проверенных партнеров, включая государственные органы и операторов критической инфраструктуры, через инициативу Project Glasswing . Эта программа, поддерживаемая правительством США, изначально стартовала с 12 учредителями, включая таких гигантов, как AWS, Google и Microsoft, чтобы позволить «защитникам» использовать ИИ для поиска и исправления уязвимостей в промышленных масштабах
. С выходом Mythos 5 доступ расширили примерно до 40 организаций
.
Таблица ниже наглядно показывает принципиальный раскол:
Пример Anthropic — самый яркий образец развертывания ИИ с разделением по уровню доступа. В этой новой реальности одна и та же передовая модель не является единым продуктом. Её полная мощность — это привилегия проверенных, а предохранители становятся механизмом, создающим продуктовую дифференциацию .
Эта модель не уникальна. Другие ведущие компании, включая OpenAI, используют похожие подходы, предоставляя версии своих мощнейших ИИ с ограниченным доступом для национальной безопасности и научных кругов . Запуск дуэта Fable/Mythos кристаллизует будущее, в котором самые мощные возможности ИИ закрыты не технологически, а статусом верификации. Протоколы безопасности при этом выполняют двойную функцию механизма контроля доступа, что уже вызывает бурные споры о централизации, справедливости и истинном значении «общественной» безопасности ИИ.
Comments
0 comments