ОтветыОпубликовано3 дня назадLast edited 3 дня назад32 источники

Защита или клетка? Почему новейший ИИ от Anthropic вызвал гнев специалистов по кибербезопасности

Исследователи кибербезопасности недовольны Claude Fable 5: защитные механизмы агрессивно блокируют даже безобидные запросы, связанные с безопасностью, и скрытно переключаются на более слабую модель без предупреждения. Основная критика направлена на механизм, который перенаправляет запросы по кибербезопасности, биоло...

Искать и проверять факты с Studio Global AI Смотреть больше популярных страниц

27K0

A conceptual illustration of a locked digital shield representing AI safety guardrails, with glowing data streams being filtered and diverted, set against a dark cybersecurity-them — What is causing cybersecurity professionals to criticize Anthropic's Claude Fable 5, and how does the model's safety guardrail system work,Anthropic's Claude Fable 5 uses aggressive, silent guardrails to keep its most powerful capabilities out of public hands, a move that has sparked intense debate in the cybersecurity community.
Промпт ИИ
Create a landscape editorial hero image for this Studio Global article: What is causing cybersecurity professionals to criticize Anthropic's Claude Fable 5, and how does the model's safety guardrail system work,. Article summary: Anthropic released Claude Fable 5 on June 9, 2026 as a guardrailed public version of its powerful Mythos-class model, alongside an unrestricted twin, Claude Mythos 5, available only to vetted partners through Project Gla. Topic tags: general, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# Claude Fable 5: Why Anthropic Put Its Most Powerful AI Behind Guardrails. * Anthropic released Claude Fable 5 on 9 June 2026. It is the first publicly available Mythos-class mode" source context "Claude Fable 5: Anthropic Locks Down Cyber and Bio" Reference image 2: visual subject "# Anthropic says these topics
openai.com

Компания Anthropic выпустила Claude Fable 5 9 июня 2026 года, представив его как самую мощную модель ИИ, доступную широкой публике. Однако релиз немедленно столкнулся с резкой критикой со стороны сообщества кибербезопасности .

Если для Anthropic это «ответственный» запуск технологии класса Mythos, то эксперты по безопасности уверены: встроенные предохранители оказались настолько агрессивными, что сделали модель практически бесполезной для проведения легальных исследований и защитных работ. И корень проблемы — не в самом факте наличия защиты, а в её непрозрачной реализации.

В чем суть критики: широкие фильтры, ломающие легальную работу

Ключевая претензия исследователей — крайняя чувствительность классификаторов контента в Fable 5. Модель, по их словам, «отклоняет любой запрос, который хоть отдаленно касается кибербезопасности — даже такие безобидные задачи, как чтение поста в блоге» . Об этом в интервью TechCrunch заявила Валентина «Chompie» Палмиотти, исследователь безопасности из IBM X-Force. Проще говоря, под блокировку попадают не только потенциально опасные, но и фундаментальные запросы на понимание основ кибербезопасности .

Такая чрезмерная фильтрация напрямую снижает полезность модели. Когда запрос помечается как небезопасный, пользователь молча получает «урезанный» ответ от более старой и слабой модели. О самом факте подмены его явно не уведомляют . Ситуацию усугубило то, как именно раскрывалась эта информация. Критики утверждают, что такое поведение было описано лишь в недрах 319-страничной сопроводительной документации (системной карты), что породило обвинения в «тайном саботаже» .

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Искать и проверять факты с Studio Global AI

Люди также спрашивают

Каков краткий ответ на вопрос «Защита или клетка? Почему новейший ИИ от Anthropic вызвал гнев специалистов по кибербезопасности»?

Какие ключевые моменты необходимо проверить в первую очередь?

Что мне делать дальше на практике?

Одновременный выпуск ограниченной публичной модели (Fable 5) и версии без ограничений для проверенных партнеров (Mythos 5) задает новый отраслевой стандарт развертывания ИИ с разделением по уровню доступа, поднимая во...

Источники

Comments

0 comments

Loading comments...

Модель	Доступ	Конфигурация безопасности	Пользовательский опыт
Claude Fable 5	Публичный (API и Claude.ai)	Активны строгие классификаторы; чувствительные запросы скрыто направляются на Claude Opus 4.8 .	Часто «тупит» на темах кибербезопасности/биологии, при этом пользователь не знает о подмене .
Claude Mythos 5	Закрытый (для партнеров Project Glasswing)	Классификаторы сняты; доступны все возможности класса Mythos .	Полный, беспрепятственный доступ, но лишь для нескольких десятков проверенных организаций .

Защита или клетка? Почему новейший ИИ от Anthropic вызвал гнев специалистов по кибербезопасности

В чем суть критики: широкие фильтры, ломающие легальную работу

Search, cite, and publish your own answer

Люди также спрашивают

Каков краткий ответ на вопрос «Защита или клетка? Почему новейший ИИ от Anthropic вызвал гнев специалистов по кибербезопасности»?

Какие ключевые моменты необходимо проверить в первую очередь?

Что мне делать дальше на практике?

Источники

Comments

Как работает система предохранителей: тихое переключение

Как Anthropic оправдывает столь жесткие настройки

Новая реальность: один «мозг» — два уровня доступа

Claude Fable 5 против Claude Mythos 5

Доступ к возможностям как привилегия