Nguyên nhân trực tiếp dẫn đến lệnh kiểm soát xuất khẩu là một vụ 'jailbreak' — một phương pháp vượt qua các rào cản an toàn của mô hình. Nhưng hai bên đã bất đồng sâu sắc về mức độ nghiêm trọng của nó.
Sự bất đồng đã leo thang nhanh chóng. Theo nhiều báo cáo, Amodei đã phản ứng mạnh mẽ trong các cuộc gọi với các quan chức chính quyền, mô tả mối quan ngại của chính phủ là một sự hiểu lầm, và tại một thời điểm, các cuộc đàm phán suýt đổ vỡ hoàn toàn .
Nhà Trắng đã chỉ định Fable 5 là một trường hợp thử nghiệm cho các rào cản mới trong sắc lệnh hành pháp về AI, phối hợp giữa Bộ Thương mại, Bộ Tài chính và chính Nhà Trắng . Chính quyền lo ngại rằng năng lực của các mô hình này có thể tạo điều kiện cho Trung Quốc tiếp cận các công cụ tấn công an ninh mạng và các công nghệ lưỡng dụng nguy hiểm khác
.
Trong vòng vài ngày sau cuộc khủng hoảng kiểm soát xuất khẩu, Nhà Trắng và Anthropic đã chuyển từ đối đầu sang đàm phán có cấu trúc . Vào ngày 17 tháng 4 năm 2026, Amodei đã gặp các quan chức Nhà Trắng trong các cuộc đàm phán được mô tả là hòa giải hiệu quả — đây là cuộc tiếp xúc cấp cao đầu tiên kể từ những căng thẳng trước đó giữa Anthropic và Lầu Năm Góc
.
Những nhân vật chủ chốt trong các cuộc thảo luận cấp cao sau đó bao gồm Bộ trưởng Thương mại Hoa Kỳ Howard Lutnick, Giám đốc An ninh mạng Quốc gia Sean Cairncross và đồng sáng lập Anthropic Tom Brown . Chính quyền đã phối hợp giữa Bộ Thương mại, Bộ Tài chính và Nhà Trắng cho trường hợp thử nghiệm Fable 5
.
Dự án trung tâm nổi lên từ các cuộc đàm phán này là một khung tuân thủ thống nhất để đánh giá mức độ nghiêm trọng của các lỗ hổng bảo mật — đặc biệt là jailbreak — trong các mô hình AI tiên tiến . Khung này được thiết kế để tạo ra các chuẩn mực chung nhằm đánh giá liệu một lỗ hổng an toàn có biện minh cho sự can thiệp của chính phủ hay không
.
Cốt lõi của nỗ lực này là một hệ thống chấm điểm thống nhất cho các vụ jailbreak. Mặc dù chưa có nhãn chính thức nào (ví dụ: "Nghiêm trọng," "Cao," "Trung bình," "Thấp") hoặc một bảng tiêu chí chi tiết nào được công bố công khai, nhưng khung này được báo cáo là đánh giá các lỗ hổng dựa trên ba tiêu chí đánh giá rủi ro :
Mục tiêu của chính phủ là sử dụng hệ thống chấm điểm này để thiết lập các ngưỡng rủi ro rõ ràng, được xác định trước nhằm tự động quyết định có nên áp đặt các biện pháp kiểm soát xuất khẩu, yêu cầu giảm thiểu rủi ro hay chặn triển khai — thay vì hành động tùy cơ sau một cuộc khủng hoảng .
Mục tiêu bao trùm của chính phủ là chuyển từ can thiệp theo kiểu phản ứng, dựa trên khủng hoảng sang một hệ thống dựa trên quy tắc . Bằng cách cùng phát triển khung đánh giá và các ngưỡng rủi ro với Anthropic, Nhà Trắng nhằm mục đích:
Sự không chắc chắn chính: Chưa có tiêu chí, phạm vi hoặc mốc thời gian chi tiết nào cho khung này được công bố công khai. Ba tiêu chí đánh giá rủi ro (bảo vệ bị vượt qua, năng lực bị lộ, tác động thực tế) đã được nhiều hãng tin đưa tin nhưng phương pháp tính điểm cụ thể vẫn chưa được tiết lộ .
Việc phát triển khung giữa Mỹ và Anthropic đang diễn ra trong bối cảnh các cuộc thảo luận của G7 về các tiêu chuẩn an toàn AI. G7 đã và đang làm việc để hướng tới các chuẩn mực quốc tế hài hòa nhằm đánh giá rủi ro AI tiên tiến . Hệ thống chấm điểm thống nhất mà Nhà Trắng và Anthropic đang xây dựng dự kiến sẽ cung cấp thông tin cho — và được thông tin bởi — các cuộc đàm phán đa phương rộng lớn hơn đó, mặc dù các kết quả cụ thể của G7 vẫn đang trong quá trình thương lượng
.
Sự phát triển của khung này đánh dấu một bước ngoặt quan trọng trong chính sách AI của Mỹ. Chỉ vài ngày trước khi áp đặt các biện pháp kiểm soát xuất khẩu, Amodei đã xuất bản một bài luận chính sách lập luận rằng các chính phủ nên nắm giữ thẩm quyền pháp lý bắt buộc để chặn hoặc đảo ngược việc triển khai các mô hình AI tiên tiến không vượt qua được các bài kiểm tra an toàn độc lập . Cuộc khủng hoảng ngày 12 tháng 6 đã đặt nguyên tắc đó vào một bài kiểm tra đối đầu bất ngờ.
Câu hỏi chính còn bỏ ngỏ: làm thế nào để xác định ranh giới giữa một lỗ hổng hẹp, có thể kiểm soát được và một rủi ro mang tính hệ thống đảm bảo sự can thiệp của chính phủ. Câu trả lời sẽ không chỉ định hình các bản phát hành trong tương lai của Anthropic mà còn định hình bối cảnh quản lý rộng lớn hơn cho sự phát triển AI tiên tiến.
Comments
0 comments