Một số cải tiến nổi bật bao gồm: về mặt năng lực, Opus 4.8 mang lại kết quả tốt hơn trong lập trình tác tử, công việc tri thức đa ngành, và sử dụng máy tính tự động . Một tính năng mới mang tên Dynamic Workflows trong Claude Code cho phép mô hình điều phối hàng trăm tác tử phụ song song để thực hiện việc di chuyển mã nguồn (code migration) quy mô lớn lên đến hàng trăm nghìn dòng lệnh
. Người dùng cũng có thêm các cấp độ nỗ lực tùy chỉnh—
high, xhigh, và max—cùng với chế độ nhanh hoạt động với tốc độ gấp 2,5 lần và chi phí rẻ hơn ba lần so với các chế độ nhanh trước đây .
Độ tin cậy cũng nhận được bản nâng cấp lớn. Opus 4.8 đã được huấn luyện để nhận diện những điểm không chắc chắn trong công việc của chính nó hiệu quả hơn. Tỷ lệ mô hình này "bỏ qua" một lỗi trong chính đoạn mã nó viết mà không đưa ra cảnh báo thấp hơn khoảng bốn lần so với phiên bản tiền nhiệm, giải quyết tình trạng gây khó chịu thường gặp khi các mô hình tiên tiến tự tin xuất ra những đoạn mã lỗi. Anthropic mô tả đây là một bước đột phá về tính trung thực của mô hình trong lĩnh vực kỹ thuật phần mềm .
Điều quan trọng là, dù Opus 4.8 là một tác tử tự chủ mạnh mẽ hơn, nó vẫn được xây dựng dựa trên các tiêu chuẩn triển khai và bảo mật Cấp độ An toàn AI 3 (ASL-3) tương tự phần còn lại của dòng Claude Opus 4. Các giao thức này bao gồm các biện pháp bảo vệ nghiêm ngặt tự động chặn các yêu cầu có dấu hiệu sử dụng vào mục đích an ninh mạng bị cấm hoặc có rủi ro cao, cũng như kiểm soát an ninh mạnh mẽ để bảo vệ trọng số mô hình khỏi bị đánh cắp bởi các tác nhân phi nhà nước tinh vi .
Câu chuyện về Claude Mythos Preview mới thực sự là thứ tách biệt ngày ra mắt này khỏi những bản cập nhật mô hình thông thường. Vào tháng 4 năm 2026, Anthropic đã tiết lộ sự tồn tại của mô hình này nhưng từ chối phát hành công khai. Vấn đề cốt lõi: Mythos Preview đã chứng minh khả năng tự động phát hiện và khai thác các lỗ hổng zero-day trên mọi hệ điều hành và trình duyệt web lớn . Viện An ninh AI Vương quốc Anh (AISI) xác nhận rằng Mythos Preview đã giải được 73% các thử thách an ninh mạng dạng cướp cờ (CTF) cấp độ chuyên gia—một kết quả đáng kinh ngạc bỏ xa các mô hình trước đó
.
Để giảm thiểu rủi ro, Anthropic tạo ra Dự án Glasswing, một sáng kiến có kiểm soát với khoảng 50 tổ chức đối tác—bao gồm AWS, Apple, Google, Microsoft, CrowdStrike và JPMorgan Chase—những người chỉ sử dụng Mythos Preview cho mục đích phòng thủ, tìm kiếm lỗ hổng . Kết quả mang tính lịch sử. Các đối tác đã tìm ra hơn 10.000 lỗ hổng mức độ nghiêm trọng cao hoặc đặc biệt nghiêm trọng trên các phần mềm quan trọng nhất toàn cầu, với hầu hết tổ chức phát hiện hàng trăm lỗi như vậy chỉ trong tháng đầu tiên được tiếp cận
. Trong số đó, 6.202 lỗi được phân loại là lỗ hổng zero-day mới, chưa từng được biết đến trước đó
. Những phát hiện này trải dài trên cơ sở hạ tầng quan trọng và bao gồm các lỗi đã tồn tại sâu bên trong hệ thống, chẳng hạn như một lỗ hổng 27 năm tuổi trong OpenBSD, một trong những hệ điều hành được gia cố bảo mật nghiêm ngặt nhất hiện nay
.
Vào ngày 28 tháng 5, Anthropic tuyên bố thử nghiệm đã thành công và công bố kế hoạch phát hành các mô hình dòng Mythos như một "lớp mô hình mới" cho tất cả khách hàng trong những tuần tới . Kết quả từ Glasswing cung cấp bằng chứng cho thấy với các rào chắn phù hợp, những mô hình này có thể được xử lý an toàn cho công tác phòng thủ không gian mạng. Các nhà phân tích trong ngành đưa tin rằng Claude Mythos 1 dự kiến sẽ ra mắt vào tháng 6 năm 2026, cạnh tranh trực tiếp với các mô hình lớn khác như Gemini 3.5 Pro và Grok 5
.
Các bản phát hành sản phẩm đi kèm một cú sốc tài chính. Cùng ngày, Anthropic thông báo đã hoàn tất vòng gọi vốn Series H trị giá 65 tỷ USD, đẩy mức định giá hậu gọi vốn (post-money) lên tới 965 tỷ USD, tăng hơn gấp đôi so với mức định giá 380 tỷ USD hồi tháng Hai . Vòng gọi vốn được dẫn dắt bởi Altimeter Capital, Dragoneer, Greenoaks và Sequoia Capital, với các khoản cam kết đáng kể từ Blackstone, D.E. Shaw, DST Global và Fidelity
.
Số vốn này chính thức đưa Anthropic trở thành công ty khởi nghiệp AI giá trị nhất thế giới, vượt qua mức định giá được xác nhận gần nhất của OpenAI là 852 tỷ USD . Anthropic cho biết dòng tiền sẽ được đầu tư vào việc mở rộng năng lực tính toán để đáp ứng nhu cầu doanh nghiệp ngày càng tăng đối với trợ lý Claude và mở rộng quy mô sản phẩm trên toàn cầu
.
Quyết định phát hành rộng rãi Mythos vấp phải không ít chỉ trích gay gắt. Trọng tâm của cuộc tranh luận là tình thế tiến thoái lưỡng nan về "lưỡng dụng" (dual-use): cùng một sức mạnh suy luận khiến Mythos trở nên xuất sắc trong việc tìm lỗ hổng để vá, cũng chính là bộ công cụ tấn công đáng sợ nhất . Các nhà phân tích cảnh báo rằng việc tiếp cận rộng rãi có thể trang bị cho các tác nhân xấu một công cụ tự động hóa việc liên kết đa lỗ hổng (exploit chain) để vượt qua các hộp cát hệ điều hành và các lớp bảo vệ trình duyệt
.
Mô hình tìm lỗi nhận thưởng (bug bounty) và hacking đạo đức truyền thống hiện phải đối mặt với câu hỏi mang tính tồn vong. Nếu một mô hình đơn lẻ có thể tự động phát hiện hàng nghìn lỗ hổng zero-day, vai trò của nhà nghiên cứu bảo mật con người sẽ chuyển từ tìm kiếm sang phân loại và ngăn chặn . Chiến lược ngăn chặn của Anthropic—sử dụng Project Glasswing để lọc quyền truy cập cho 50 doanh nghiệp đã được kiểm duyệt—nhận về cả lời khen và chỉ trích. Phe ủng hộ lập luận rằng nó ngăn chặn nguy cơ rò rỉ thảm khốc trong khi vẫn chứng minh được giá trị phòng thủ của mô hình; phe phản đối cho rằng việc giữ một công cụ như vậy xa rời cộng đồng bảo mật rộng lớn sẽ làm chậm quá trình vá lỗi toàn cầu
.
Thông báo ngày 28 tháng 5 đánh dấu sự kết thúc của một cuộc thử nghiệm và khởi đầu cho một giai đoạn mới. Anthropic đang đặt cược rằng lợi ích phòng thủ của một mô hình dòng Mythos được phổ biến rộng rãi sẽ lớn hơn rủi ro về khả năng tấn công, một canh bạc sẽ được kiểm chứng ngay khi nó chính thức ra mắt.
Comments
0 comments