claude-mythos-5): 제한적 접근 모델입니다. 페이블 5와 동일한 기반 모델과 가중치를 사용하지만, 특정 영역에서 안전 분류기가 제거되었습니다. 일반에게는 제공되지 않으며, 승인된 '프로젝트 글래스윙(Project Glasswing)' 파트너에게만 초기 제공됩니다 구독자를 위한 페이블 5 접근에는 엄격한 기한이 정해져 있습니다.
6월 23일 이후에도 API, AWS·버텍스 AI와 같은 클라우드 플랫폼, 소비 기반 엔터프라이즈 요금제를 통해서는 페이블 5를 계속 이용할 수 있습니다 . 미토스 5는 일반 구독으로는 영원히 제공되지 않으며, 앤트로픽의 신뢰 기반 접근 프로그램 뒤에 잠겨 있습니다
.
위험한 질문을 단순히 차단하는 대신, 페이블 5는 오용 및 탈옥 시도를 감시하는 일련의 외부 AI 시스템(분류기)을 사용합니다. 사용자가 분류기를 작동시키면, 요청이 거부되지 않고 조용히 덜 강력한 모델인 클로드 오퍼스 4.8로 넘어가며, 사용자에게 이 사실이 알려집니다 .
이 '우회' 메커니즘은 주로 세 가지 영역에서 활성화됩니다.
앤트로픽은 이 시스템이 보수적으로 조정되어 있어 무해한 요청에도 반응할 수 있지만, 평균적으로 전체 세션의 5% 미만에서만 안전장치가 작동한다고 밝혔습니다 . 이 시스템은 1,000시간 이상의 테스트에서 범용 탈옥을 찾지 못한 외부 버그 바운티 프로그램을 포함한 광범위한 테스트를 거쳤습니다
. 출력이 생성되기 전에 오퍼스 4.8로의 대체가 발생한 프롬프트에 대해서는 요금이 부과되지 않으며, 모델 전환으로 인한 프롬프트-캐시 비용도 환불됩니다
.
이번 출시와 함께 중요한 정책 변화가 생겼습니다. 클로드 페이블 5와 클로드 미토스 5는 새로운 데이터 보존 정책에 따라 '대상 모델(Covered Models)'로 지정되었습니다. 즉, 이 모델들은 30일의 의무 데이터 보존 기간이 적용되며, 일부 기업 고객들이 중요하게 생각하는 '데이터 무보존(zero-data-retention)' 계약이 불가능합니다 .
클로드 미토스 5는 페이블 5에 적용된 안전망이 없는, 능력의 최전선을 보여줍니다. 그 배포는 신뢰 기반 접근 프로그램을 통해 관리됩니다.
앤트로픽은 자체 벤치마크와 파트너 테스트 결과, 페이블 5가 "AI 능력에 대해 테스트된 거의 모든 벤치마크에서 최첨단" 성능을 보여주었다고 밝혔습니다 . 주요 성능 하이라이트는 다음과 같습니다.
Comments
0 comments