Trả lời các hãng truyền thông như BBC và Moneycontrol, Palmiotti giải thích rằng công nghệ đang phát triển đến mức ngay cả những tài năng hàng đầu của con người cũng có thể trở nên không còn sức cạnh tranh. Cô dự đoán các cuộc thi hack AI có thể khiến những cuộc thi như Pwn2Own trở nên lỗi thời, bởi vì tốc độ xử lý thô, quy mô và tính tự chủ của các hệ thống như Mythos là điều mà không cá nhân nào, dù tài giỏi đến đâu, có thể sánh kịp .
Điều quan trọng, lời cảnh báo của cô không phải là AI sẽ ngay lập tức thay thế tất cả các nhà nghiên cứu bảo mật, mà là nó đang vượt qua một ngưỡng năng lực làm thay đổi tính kinh tế của việc ai – hay cái gì – tìm ra những lỗ hổng nghiêm trọng nhất trước tiên. Quỹ đạo đó, cô lập luận, đang hướng về phía máy móc .
Claude Mythos Preview không phải là một công cụ an ninh mạng chuyên biệt. Nó là một mô hình ngôn ngữ đa năng, thế hệ kế nhiệm của dòng Claude nhà Anthropic. Nó không được huấn luyện đặc biệt để trở thành hacker. Vậy mà khi các khả năng của nó được đánh giá, kết quả đã gây sốc ngay cả những người tạo ra nó .
Anthropic xác nhận rằng Mythos Preview đã tự động phát hiện ra hàng nghìn lỗ hổng bảo mật mức độ nghiêm trọng cao trên mọi hệ điều hành lớn và mọi trình duyệt web lớn. Điều này bao gồm những lỗ hổng chưa từng được biết đến trước đây (zero-day) mà chưa có nhà nghiên cứu con người nào từng phát hiện ra . Một báo cáo mô tả nó đã tạo ra 303 trang phát hiện lỗ hổng chỉ trong 21 phút
.
Các mô hình AI trước đây đôi khi có thể tìm ra lỗ hổng, nhưng hầu như không bao giờ tự động xây dựng được một mã khai thác hoạt động. Trên một bài kiểm tra chuyển đổi các lỗ hổng đã biết trong trình duyệt Firefox thành các vụ khai thác hệ thống, Mythos Preview đã thành công 181 lần. Mô hình tốt nhất trước đó của Anthropic, Claude Opus 4.6, có tỷ lệ thành công gần như bằng không . Đây không phải là một sự cải thiện từ từ – nó đại diện cho một ngưỡng năng lực đã bị vượt qua
.
Mythos có thể phân tích phần mềm mã nguồn đóng hoặc đã được biên dịch ngay cả khi thông tin gỡ lỗi mà con người có thể đọc được đã bị loại bỏ. Nó kiểm tra mã cấp máy thô, hiểu cách chương trình hoạt động và phát hiện ra các lỗ hổng mà nếu không có quyền truy cập mã nguồn thì sẽ không thể nhìn thấy .
Các nhà nghiên cứu đã sử dụng một khung sườn đơn giản: đóng gói cơ sở mã mục tiêu vào container, gọi mô hình với Claude Code chạy Mythos Preview, và đưa ra một đoạn lệnh duy nhất yêu cầu nó tìm lỗ hổng. Sau đó, mô hình này đã tự động xác định và viết mã khai thác cho các lỗ hổng bảo mật chưa từng được biết đến . Viện An ninh AI của Vương quốc Anh (AISI) đã đánh giá độc lập Mythos và xác nhận khả năng mạng tiên tiến của nó
.
Anthropic đã nói rõ: khả năng tấn công mạng của mô hình không được huấn luyện một cách có chủ ý. Chúng "nổi lên như một hệ quả phụ của những cải tiến chung về lập trình, suy luận và tính tự chủ" . Cũng chính những cải tiến giúp mô hình hiệu quả hơn trong việc vá lỗ hổng cũng khiến nó hiệu quả hơn trong việc khai thác chúng. Điều này mang lại những hệ lụy to lớn về quản trị: nếu khả năng tấn công là một đặc tính nổi lên của sức mạnh suy luận tổng quát, thì các mô hình trong tương lai, thậm chí còn mạnh mẽ hơn, có thể không thể làm cho an toàn nếu không giới hạn cơ bản trí thông minh của chúng
.
Khi Anthropic ra mắt Claude Mythos Preview vào tháng 4 năm 2026, công ty đã làm một điều mà chưa có phòng thí nghiệm AI lớn nào từng làm trước đây: công bố mô hình mạnh nhất của mình và đồng thời nói với công chúng rằng họ không thể sử dụng nó .
Công ty đã tạo ra Dự án Glasswing, một chương trình hạn chế truy cập, giới hạn Mythos Preview cho khoảng 50 tổ chức được kiểm tra kỹ lưỡng. Những tổ chức này bao gồm các công ty công nghệ lớn như Apple, Amazon Web Services, Microsoft, Google, Cisco, CrowdStrike, Broadcom, Palo Alto Networks và Nvidia, cũng như các nhà vận hành hạ tầng quan trọng như JPMorgan Chase. Các cơ quan chính phủ Hoa Kỳ, bao gồm Cơ quan An ninh Quốc gia (NSA), cũng được cấp quyền truy cập . Mục tiêu là bảo vệ các phần mềm quan trọng nhất thế giới trước tiên, tạo lợi thế khởi đầu cho những người phòng thủ trước khi các AI tấn công tương tự – hoặc mạnh hơn – chắc chắn sẽ phổ biến rộng rãi
.
Lý do của Anthropic rất đơn giản: mô hình này đơn giản là quá nguy hiểm để phát hành rộng rãi. Công ty thừa nhận Mythos "hiện đang bỏ xa bất kỳ mô hình AI nào khác về khả năng mạng" và nó "báo trước một làn sóng mô hình sắp tới có thể khai thác lỗ hổng theo những cách vượt xa nỗ lực của những người phòng thủ" . Trong tay kẻ xấu, nó có thể dàn dựng các cuộc tấn công mạng phối hợp vào lưới điện, bệnh viện và hệ thống tài chính
.
Tình hình leo thang khi Anthropic đề xuất mở rộng quyền truy cập từ khoảng 50 tổ chức lên 120. Nhà Trắng đã chặn đứng kế hoạch mở rộng đó – trường hợp đầu tiên được biết đến khi chính phủ Hoa Kỳ hạn chế việc triển khai thương mại một mô hình AI dựa trên các cân nhắc chính sách, thay vì một luật hay quy định cụ thể nào . Các quan chức viện dẫn lo ngại mô hình có thể rơi vào tay đối thủ và nghi ngờ liệu Anthropic có đủ năng lực tính toán (compute) để phục vụ một tập hợp người dùng mở rộng mà không làm giảm chất lượng dịch vụ cho các đối tác liên bang quan trọng hay không
.
Trong khi đó, Lầu Năm Góc đã công bố các thỏa thuận hợp tác AI trên mạng mật với tám công ty – OpenAI, Google, Microsoft, AWS, Nvidia, SpaceX, Oracle và xAI – và công khai loại Anthropic ra khỏi danh sách, báo hiệu những căng thẳng ngày càng tăng giữa công ty và bộ máy quốc phòng Hoa Kỳ .
Hiện tại, Mythos vẫn ở sau những cánh cửa khóa chặt. Ba ngân hàng lớn của Nhật Bản đã được cấp quyền truy cập vào tháng 5 năm 2026, đưa đất nước này trở thành một trong những quốc gia đầu tiên ngoài Hoa Kỳ sử dụng mô hình này cho mục đích phòng thủ .
Sự xuất hiện của Claude Mythos đã châm ngòi cho một cuộc tranh luận triết học cấp bách trong an ninh mạng. Liệu các nhà nghiên cứu lỗ hổng bảo mật loài người có một tương lai khả thi, hay chúng ta đang chứng kiến khởi đầu của sự kết thúc?
1. AI là công cụ hỗ trợ, chưa thể thay thế. Bản thân Palmiotti sử dụng Claude Code để tăng cường hiệu quả trong khi vẫn dựa vào kỹ năng của con người để hiểu ngữ cảnh và suy luận sáng tạo. Nhiều nhà nghiên cứu lập luận rằng chuyên môn của con người vẫn rất quan trọng cho chiến lược cấp cao, hiểu mục đích và logic kinh doanh của một hệ thống, và khả năng suy luận chuỗi tấn công sáng tạo mà các mô hình chưa thể sao chép .
2. Kiểm soát truy cập bảo tồn vai trò của con người – ít nhất là lúc này. Mythos bị khóa cho khoảng 50 tổ chức. Phần lớn các chương trình "bug bounty", kiểm tra xâm nhập và đánh giá lỗ hổng vẫn được thực hiện bởi các nhà nghiên cứu con người sử dụng các công cụ kém mạnh mẽ hơn nhiều. Mặc dù điều này thay đổi biên giới công nghệ, nó không làm tan biến ngành công nghiệp khổng lồ hiện có .
3. Các lĩnh vực mới và khả năng phán đoán. Con người vẫn giữ lợi thế trong việc phát hiện các lỗ hổng logic nghiệp vụ, tiến hành các đánh giá kỹ thuật xã hội đa sắc thái và đưa ra phán đoán ngữ cảnh dựa trên rủi ro mà các mô hình AI hiện tại có thể bỏ qua hoặc hiểu sai. AI có thể tìm thấy một lỗi tràn bộ đệm có thể khai thác về mặt kỹ thuật; một nhà nghiên cứu con người có thể cho bạn biết liệu lỗi tràn đó có thực sự quan trọng trong bối cảnh kinh doanh hay không .
1. Tốc độ và quy mô thô vượt ngoài tầm với của con người. Mythos có thể nhập vào toàn bộ kho mã, tìm lỗ hổng và viết mã khai thác trong vài phút – công việc mà một nhóm con người lành nghề có thể mất hàng tuần hoặc hàng tháng. Một ấn phẩm mô tả nó là "một AI có thể đột nhập vào hầu hết mọi máy tính trên Trái Đất" sau khi nó tìm thấy hàng nghìn lỗ hổng chưa biết trên tất cả các hệ điều hành lớn cùng một lúc .
2. Các cuộc thi hack ưu tú đang trở thành sân khấu trình diễn AI. Dự đoán của Palmiotti rằng các cuộc thi hack như Pwn2Own có thể trở nên lỗi thời không chỉ là một cảm giác – đó là một quan sát mang tính cấu trúc. Nếu một mô hình có thể tìm và chuỗi các lỗ hổng mà trước đây có thể yêu cầu nhiều đội ưu tú, tính kinh tế của việc săn lỗ hổng sẽ thay đổi về cơ bản .
3. Lợi thế về chi phí và hiệu quả là áp đảo. Một hệ thống AI duy nhất có thể quét hàng triệu dòng mã, kết nối các lỗ hổng nhỏ thành chuỗi khai thác quan trọng và hoạt động ở quy mô mà không con người nào có thể duy trì. Điều này thay đổi cơ bản những gì có thể trong việc phát hiện lỗ hổng – không phải vì con người kém hiệu quả, mà vì họ không thể cạnh tranh về khối lượng .
Cuộc tranh luận này khó có thể có một hồi kết rõ ràng. Nhiều khả năng, tương lai trước mắt sẽ phân nhánh: một vòng tròn bên trong gồm những người phòng thủ được tăng cường bởi AI, sử dụng các công cụ như Mythos dưới sự kiểm tra nghiêm ngặt của chính phủ và doanh nghiệp, và một vòng tròn bên ngoài rộng lớn nơi phần lớn công việc bảo mật vẫn ngoan cố được thực hiện thủ công bởi con người. Khoảng cách giữa hai vòng tròn đó đang thu hẹp dần.
Comments
0 comments