Một số nguồn cho biết hệ thống đã tự động tìm ra số lượng lớn lỗ hổng chưa từng được biết đến (zero‑day) trong nhiều hệ điều hành và trình duyệt phổ biến.
Ví dụ, các công bố liên quan đến chương trình đề cập tới một lỗi trong ngăn xếp mạng của OpenBSD tồn tại suốt hàng chục năm nhưng vẫn vượt qua các vòng rà soát mã và kiểm thử bảo mật.
Tuy vậy, vẫn còn nhiều điểm chưa rõ. Cho đến nay chưa có báo cáo kỹ thuật đầy đủ được công bố công khai để xác nhận độc lập tổng số lỗ hổng mà mô hình phát hiện hoặc tỷ lệ thành công khi biến chúng thành mã khai thác thực tế.
Thay vì ra mắt Mythos như một sản phẩm AI thông thường, Anthropic đã tạo ra Project Glasswing, một sáng kiến an ninh mạng với quyền truy cập được kiểm soát nhằm cho các tổ chức phòng thủ tiếp cận sớm công nghệ này.
Sáng kiến quy tụ một nhóm nhỏ các công ty công nghệ và an ninh mạng lớn, bao gồm:
Những tổ chức này cùng sử dụng mô hình để tìm và vá lỗ hổng trong các phần mềm được sử dụng rộng rãi.
Lý do khá rõ ràng: một hệ thống có khả năng phát hiện và khai thác lỗ hổng ở quy mô lớn cũng có thể trở thành công cụ tấn công cực kỳ mạnh nếu rơi vào tay kẻ xấu.
Bằng cách giới hạn quyền truy cập cho các tổ chức đã được kiểm chứng và tập trung vào bảo vệ hạ tầng quan trọng, Anthropic muốn sửa các lỗ hổng trước khi chúng bị khai thác ngoài thực tế.
Chiến lược này thường được mô tả như cách triển khai “defense‑first” (ưu tiên phòng thủ) cho một công nghệ AI có tính chất “dual‑use” — tức có thể dùng cho cả mục đích tốt lẫn xấu.
Sự xuất hiện của Mythos nhanh chóng thu hút sự chú ý của các cơ quan quản lý và an ninh quốc gia.
Tại Mỹ, Nhà Trắng đã yêu cầu các công ty công nghệ cung cấp thêm thông tin về nguy cơ tấn công mạng do AI điều khiển, một phần do lo ngại từ khả năng của các mô hình như Mythos.
Trong lĩnh vực tài chính, các cơ quan quản lý cũng quan tâm đặc biệt. Lý do là các lỗ hổng trong phần mềm phổ biến có thể ảnh hưởng trực tiếp tới ngân hàng, hệ thống thanh toán và hạ tầng tài chính toàn cầu. Một số báo cáo cho biết các cơ quan quản lý đã tổ chức họp với lãnh đạo ngân hàng lớn sau khi thông tin về khả năng của mô hình được công bố.
Ở cấp độ quốc tế, Quỹ Tiền tệ Quốc tế (IMF) cảnh báo rằng các hệ thống AI có khả năng phá vỡ phòng thủ phần mềm có thể tạo ra rủi ro hệ thống cho hạ tầng tài chính toàn cầu và cần có sự phối hợp quốc tế để quản lý.
Song song đó, các cơ quan tình báo và an ninh mạng cũng đang nghiên cứu cách những công cụ như Mythos có thể thay đổi cả phòng thủ mạng lẫn chiến dịch tấn công mạng trong tương lai.
Một trong những lo ngại lớn nhất của giới an ninh mạng là tốc độ.
Trước đây, việc tìm ra các lỗ hổng nghiêm trọng trong phần mềm phức tạp thường mất nhiều tháng hoặc nhiều năm. Các công cụ tự động như fuzzing giúp tăng tốc quá trình này, nhưng vẫn cần các nhà nghiên cứu bảo mật con người.
Nếu AI có thể tự động:
thì khoảng thời gian từ phát hiện lỗ hổng → biến thành công cụ tấn công → triển khai trên diện rộng có thể rút ngắn đáng kể.
Các nhà phân tích gọi hiện tượng này là sự rút ngắn của “cyber‑risk cycle” — chu kỳ từ khi lỗi tồn tại cho đến khi nó bị khai thác ngoài thực tế.
Dù quyền truy cập bị hạn chế, vẫn đã xuất hiện một số lo ngại về bảo mật.
Một báo cáo cho biết một nhóm nhỏ từng truy cập trái phép vào môi trường thử nghiệm của Mythos thông qua hệ thống của một nhà cung cấp bên thứ ba. Sự việc này không phải là vi phạm trực tiếp vào hạ tầng của Anthropic nhưng vẫn gây chú ý trong cộng đồng bảo mật.
Do thông tin công khai còn hạn chế, nhiều câu hỏi vẫn chưa có lời giải rõ ràng:
Thiếu các bài báo khoa học hoặc benchmark công khai khiến nhiều tuyên bố mạnh về Mythos vẫn khó kiểm chứng độc lập.
Ngay cả khi còn thiếu dữ liệu đầy đủ, trường hợp Mythos cho thấy một xu hướng đang hình thành trong ngành an ninh mạng: AI có thể trở thành công cụ mạnh nhất cho cả phòng thủ và tấn công mạng.
Quyết định hạn chế phát hành mô hình của Anthropic và chỉ triển khai qua liên minh phòng thủ phản ánh nỗi lo rằng việc mở quyền truy cập rộng rãi có thể làm gia tăng mạnh quy mô các cuộc tấn công mạng.
Liệu Project Glasswing có giúp cân bằng cuộc chơi — dùng AI để vá lỗi nhanh hơn kẻ tấn công có thể khai thác — có thể sẽ định hình cách các hệ thống AI tiên tiến được phát hành và quản lý trong tương lai.
Comments
0 comments