claude-fable-5claude-mythos-5): Là mô hình bị hạn chế truy cập. Nó sử dụng cùng một mô hình nền tảng và trọng số (weights) như Fable 5 nhưng đã được gỡ bỏ các bộ phân loại an toàn ở một số lĩnh vực cụ thể. Nó không có sẵn cho tất cả mọi người và ban đầu chỉ giới hạn cho các đối tác đã được phê duyệt của Dự án Glasswing (Project Glasswing) Cả hai mô hình đều được xây dựng trên cửa sổ ngữ cảnh 1 triệu token và có thể tạo ra tối đa 128.000 token đầu ra cho mỗi yêu cầu .
Việc truy cập Fable 5 cho người đăng ký có một thời hạn 'chết':
Sau ngày 23 tháng 6, Fable 5 vẫn có thể truy cập thông qua API, các nền tảng đám mây như AWS và Vertex AI, và các gói Enterprise trả phí theo mức sử dụng . Mythos 5 sẽ không bao giờ có sẵn thông qua các gói đăng ký tiêu chuẩn; nó vẫn bị khóa sau chương trình truy cập tin cậy của Anthropic
.
Thay vì chỉ đơn giản chặn một câu hỏi nguy hiểm, Fable 5 sử dụng một tập hợp các hệ thống AI bên ngoài (bộ phân loại) có nhiệm vụ giám sát các nỗ lực lạm dụng và 'bẻ khóa' mô hình. Khi người dùng kích hoạt một bộ phân loại, yêu cầu không bị từ chối. Thay vào đó, mô hình sẽ lặng lẽ 'rút lui' về một hệ thống kém năng lực hơn, Claude Opus 4.8, và người dùng sẽ được thông báo về điều này .
Cơ chế dự phòng này hoạt động trong ba lĩnh vực chính:
Công ty thừa nhận hệ thống được tinh chỉnh một cách thận trọng và có thể 'bắt nhầm' các yêu cầu vô hại, nhưng tuyên bố rằng các biện pháp bảo vệ này chỉ kích hoạt trung bình trong chưa đầy 5% tổng số phiên làm việc . Hệ thống đã trải qua quá trình kiểm tra kỹ lưỡng, bao gồm một chương trình 'bug bounty' (săn lỗi nhận thưởng) bên ngoài và không hề tìm thấy cách bẻ khóa phổ quát nào sau hơn 1.000 giờ thử nghiệm
. Người dùng sẽ không bị tính phí cho các lời nhắc kích hoạt sự 'rút lui' về Opus 4.8 trước khi bất kỳ đầu ra nào được tạo và chi phí bộ nhớ đệm lời nhắc cho việc chuyển đổi mô hình sẽ được hoàn trả
.
Một thay đổi chính sách quan trọng đi kèm với lần ra mắt này. Cả Claude Fable 5 và Claude Mythos 5 đều được chỉ định là "Mô hình Được Bao phủ" theo một chính sách lưu trữ dữ liệu mới. Điều này có nghĩa là chúng đi kèm với thời hạn lưu trữ dữ liệu bắt buộc 30 ngày và không khả dụng theo các thỏa thuận không lưu trữ dữ liệu (zero-data-retention), điều mà một số khách hàng doanh nghiệp có thể dựa vào .
Claude Mythos 5 đại diện cho 'tiền tuyến' năng lực không có các mạng lưới an toàn được áp dụng cho Fable 5. Quá trình triển khai nó đang được quản lý thông qua một chương trình truy cập tin cậy:
Anthropic báo cáo rằng các điểm chuẩn nội bộ và thử nghiệm của đối tác cho thấy Fable 5 "dẫn đầu về hầu hết các bài kiểm tra chuẩn về năng lực AI" . Những điểm nổi bật về hiệu suất chính bao gồm:
Comments
0 comments