Anthropic phát hành Claude Fable 5 (mô hình tổng quát công khai) và Claude Mythos 5 (cùng mô hình nền tảng nhưng loại bỏ các biện pháp bảo vệ an ninh mạng, chỉ giới hạn cho các nhà phòng thủ đã được thẩm định) vào ngày 9-10/6/2026 . Vào ngày 12 tháng 6 lúc 5:21 chiều theo giờ ET, Bộ Thương mại Mỹ ban hành chỉ thị kiểm soát xuất khẩu khẩn cấp yêu cầu Anthropic vô hiệu hóa ngay lập tức cả hai mô hình đối với bất kỳ người nước ngoài nào, bao gồm cả nhân viên nước ngoài của chính Anthropic
. Anthropic đã tuân thủ ngay trong cùng ngày, đình chỉ truy cập toàn cầu
.
Nguyên nhân trực tiếp: Nhà nghiên cứu an ninh mạng Katie Moussouris đã chứng minh rằng các mô hình có thể bị kích hoạt bằng lệnh chỉ gồm ba từ đơn giản "Fix this code" để tự động dịch ngược và vũ khí hóa các lỗ hổng phần mềm, gây ra báo động an ninh quốc gia . Amazon, một nhà đầu tư của Anthropic, đã báo cáo cho Nhà Trắng sau khi tiến hành đánh giá bảo mật nội bộ
.
Vào tháng 4/2026, Anthropic đã điều tra các cáo buộc rằng một nhóm nhỏ đã truy cập trái phép vào mô hình xem trước Claude Mythos trước đó — một hệ thống mà chính Anthropic mô tả là quá mạnh để phát hành công khai . Sự cố này đã báo trước những lo ngại rộng hơn về rủi ro phổ biến, sau đó đã kích hoạt lệnh đóng cửa Fable 5.
OpenAI ra mắt Daybreak, một sáng kiến an ninh mạng lớn, vào ngày 11/5/2026 — cùng ngày Nhóm Tình báo Mối đe dọa của Google tiết lộ trường hợp đầu tiên được xác nhận về việc tin tặc sử dụng AI để xây dựng một exploit zero-day . Daybreak kết hợp các lớp mô hình GPT-5.5 (bao gồm một biến thể "GPT-5.5-Cyber" cho phép kiểm tra thâm nhập) với các tác nhân Codex Security và hơn 20 đối tác bảo mật (Cloudflare, CrowdStrike, Palo Alto Networks, v.v.) để tự động hóa việc phát hiện lỗ hổng, xác thực bản vá và khắc phục ở tốc độ máy
. Nó được coi là phản ứng cạnh tranh trực tiếp của OpenAI đối với các dịch vụ Project Glasswing / Mythos trước đó của Anthropic
.
Vào ngày 1/5/2026, sáu cơ quan an ninh mạng trong Five Eyes (CISA, NSA, ASD ACSC, CCCS, NZ NCSC, UK NCSC) đã công bố "Careful Adoption of Agentic AI Services" — hướng dẫn bảo mật đa chính phủ phối hợp đầu tiên nhắm mục tiêu cụ thể vào các tác nhân AI tự động . Hướng dẫn xác định năm loại rủi ro (đặc quyền, thiết kế/cấu hình, hành vi, trách nhiệm giải trình và rủi ro dữ liệu/vận hành) và cảnh báo rằng các tác nhân tự động "hành động, quyết định và tương tác qua các hệ thống theo những cách khó dự đoán, kiểm toán hoặc kiểm soát" đã và đang hoạt động trong cơ sở hạ tầng quan trọng với các biện pháp bảo vệ không đầy đủ
. Cảnh báo tháng 5 này đã đặt nền tảng chính sách cho tuyên bố ngày 22/6, vốn đã leo thang thành lời kêu gọi hành động khẩn cấp và rộng rãi hơn.
Cảnh báo về AI tác nhân tháng 5 đã xác định các rủi ro mang tính hệ thống. Sự cố truy cập Mythos và lỗ hổng "Fix this code" trong Fable 5 đã chứng minh rằng những rủi ro đó đã và đang trở nên hữu hình trong các mô hình tiên tiến ngoài đời thực. Việc ra mắt Daybreak của OpenAI đã làm gia tăng động lực cạnh tranh và an ninh. Tuyên bố ngày 22/6 đại diện cho kết luận thống nhất của Five Eyes rằng cơ hội hành động phòng thủ đã thu hẹp từ vài năm xuống còn vài tháng.
Comments
0 comments