Báo cáoĐã xuất bản2 tháng trướcLast edited tháng trước37 nguồn

Anthropic tung 'át chủ bài' mới: Claude Opus 4.8 mạnh mẽ, trung thực và tiết kiệm hơn hẳn

Claude Opus 4.8 chính thức ra mắt ngày 28/05/2026, là bản nâng cấp trực tiếp từ Opus 4.7 với mức giá không đổi: 5 USD cho 1 triệu token đầu vào, 25 USD cho 1 triệu token đầu ra. Điểm nhấn nằm ở khả năng 'tự kiểm điểm': Opus 4.8 ít có khả năng bỏ qua lỗi code hơn gấp 4 lần so với phiên bản tiền nhiệm, đánh dấu bước t...

Tìm kiếm và kiểm chứng sự thật với Studio Global AI Duyệt thêm trang xu hướng

What is Anthropic's newly released Claude Opus 4.8 model, including its benchmark improvements over Opus 4.7, key features like effort contrAnthropic's Claude Opus 4.8 is a direct upgrade to Opus 4.7 with improved coding, honesty, and user controls, all at the same price.

Prompt AI

Create a landscape editorial hero image for this Studio Global article: What is Anthropic's newly released Claude Opus 4.8 model, including its benchmark improvements over Opus 4.7, key features like effort contr. Article summary: **Model:** Claude Opus 4.8 is listed in the official Claude API pricing table and is also listed as a model supported by fast mode.. Topic tags: deepresearch, general web, user generated, documentation. Reference image context from search candidates: Reference image 1: visual subject "Anthropic released Claude Opus 4.8 today, and it outperforms its predecessor across most major benchmarks while beating OpenAI’s GPT-5.5 and Google’s Gemini 3.1 Pro in several key" source context "Anthropic Just Dropped Claude Opus 4.8. - The VC Corner" Reference image 2: visual subject "Anthropic released Claude Opus 4.8 today, and it outperforms its predecessor across most major

openai.com

Anthropic đã chính thức phát hành Claude Opus 4.8 vào ngày 28 tháng 5 năm 2026, thay thế Opus 4.7 để trở thành mô hình AI công khai mạnh mẽ nhất của hãng. Đây không phải là một cuộc cách mạng về kiến trúc, mà là một bản nâng cấp tập trung, siết chặt độ trung thực của mô hình, cải thiện hiệu suất lập trình và bổ sung các quyền kiểm soát mới cho người dùng, đồng thời giữ nguyên mức giá cốt lõi .

Trong bài đăng trên blog chính thức, Anthropic mô tả Opus 4.8 là "một cộng tác viên hiệu quả hơn", được xây dựng dựa trên Opus 4.7 với những cải thiện trên mọi tiêu chuẩn đánh giá . Trên thực tế, điều đó đồng nghĩa với một mô hình khó bị qua mặt hơn trong việc phê duyệt code lỗi, dễ kiểm soát hơn cho cả nhà phát triển lẫn người dùng thông thường, và rẻ hơn đáng kể khi vận hành ở tốc độ cao.

Những cải tiến về điểm chuẩn so với Opus 4.7

Opus 4.8 ghi nhận những mức tăng trưởng có thể đo lường được trên bộ đánh giá chính của Anthropic. Tại SWE-Bench Verified, tiêu chuẩn vàng cho việc sửa lỗi thực tế, Opus 4.8 đạt 88.6%, tăng so với mức 87.6% của Opus 4.7 .

Bước nhảy vọt ý nghĩa hơn là ở SWE-Bench Pro, một bài kiểm tra lập trình tác nhân đa ngôn ngữ khó hơn. Tại đây, Opus 4.8 chạm mốc 69.2%, cải thiện 4.9 điểm so với mức 64.3% của Opus 4.7 và dẫn trước hai chữ số so với GPT-5.5 (58.6%) và Gemini 3.1 Pro (54.2%) .

Ở bài kiểm tra Terminal-Bench 2.1, vốn đánh giá khả năng lập trình tác nhân trên dòng lệnh, Opus 4.8 đạt 74.6%. Mô hình này vẫn xếp sau GPT-5.5 với 78.2% nhưng đã có một cú nhảy vọt đáng kể so với mức 66.1% của Opus 4.7 trong cùng bài đánh giá . Với khả năng sử dụng máy tính tác nhân, Opus 4.8 đạt 83.4% trên OSWorld-Verified, nhỉnh hơn một chút so với Opus 4.7 (82.8%) và GPT-5.5 (78.7%) .

Đối với các tác vụ tri thức được đo lường bởi GDPval-AA, Opus 4.8 đạt mức Elo 1890, bỏ xa GPT-5.5 (1769) và tạo khoảng cách lớn với Gemini (1314) . Trong kỳ thi Humanity's Last Exam về suy luận đa ngành, mô hình này ghi được 57.9% khi dùng công cụ – kết quả truy cập chung cao nhất của Anthropic – so với 49.8% khi không dùng công cụ .

Độ trung thực và sự liên kết: Một mô hình an toàn hơn

Anthropic định vị Opus 4.8 là một mô hình có độ trung thực cao hơn một cách ý nghĩa. Trong các đánh giá nội bộ của công ty, Opus 4.8 ít có khả năng để lọt các lỗi lập trình mà không nhận xét trong các bài tự đánh giá của mình hơn khoảng bốn lần so với Opus 4.7 .

Tỷ lệ hành vi không liên kết – bao gồm lừa dối hoặc hợp tác với các mục đích lạm dụng – thấp hơn đáng kể so với Opus 4.7 và tương đương với Claude Mythos Preview, mô hình được Anthropic coi là có sự liên kết tốt nhất . Điều này rất quan trọng đối với các nhà phát triển dựa vào AI để xem xét hoặc tạo ra code sản phẩm và cần một mô hình biết chỉ ra điểm mù của chính mình thay vì tự tin đưa ra những kết quả có lỗi.

'Cần câu' điều khiển nỗ lực đã có mặt trên claude.ai và Claude Code

Thay đổi dễ thấy nhất với người dùng là một nút xoay điều khiển mức độ nỗ lực mới, hiện đã có sẵn trên claude.ai và giao diện Cowork . Người dùng có thể chọn mức độ nỗ lực tính toán mà Claude áp dụng cho một phản hồi qua nhiều cấp độ:

Thấp (Low): Phản hồi nhanh hơn, tiêu hao giới hạn tốc độ chậm hơn.
Cao (High): Mặc định mới cho Opus 4.8, mang lại sự cân bằng giữa chất lượng và tốc độ.
Rất cao (xhigh): Suy luận kỹ lưỡng hơn, được khuyến nghị cho các tác vụ khó và quy trình làm việc dài hạn.
Tối đa (Max): Độ sâu tối đa cho các vấn đề hóc búa nhất .

Trong Claude Code, Anthropic đã tăng giới hạn tốc độ để phù hợp với lượng token sử dụng cao hơn đi kèm với các mức nỗ lực nâng cao . Điều này cho phép các nhà phát triển có những sự đánh đổi tinh chỉnh hơn giữa độ trễ, chi phí và độ sâu suy luận đối với các tác vụ lập trình và tác nhân phức tạp.

Luồng công việc động (Dynamic Workflows) trong Claude Code

Đối với các nhà phát triển đang giải quyết những vấn đề ở quy mô cực lớn, Anthropic đang triển khai tính năng Luồng công việc động dưới dạng bản xem trước nghiên cứu trong Claude Code dành cho người dùng gói Doanh nghiệp, Nhóm và Max .

Tính năng này cho phép Claude lập kế hoạch cho một nhiệm vụ, sau đó sinh ra và chạy hàng trăm tác nhân phụ song song trong một phiên làm việc duy nhất. Các kết quả đầu ra sẽ được xác minh trước khi báo cáo, giúp hệ thống phù hợp với các cuộc 'đại trùng tu' cơ sở mã lên tới hàng trăm nghìn dòng code .

Giá cả và chế độ Fast Mode

Mức giá tiêu chuẩn cho Opus 4.8 vẫn giữ nguyên như Opus 4.7: 5 USD cho một triệu token đầu vào và 25 USD cho một triệu token đầu ra . Phí ghi và làm mới bộ nhớ đệm prompt vẫn nhất quán với dòng Opus cao cấp .

Sự thay đổi đáng kể hơn về giá nằm ở khía cạnh tốc độ. Chế độ Fast Mode cho Opus 4.8 mang lại khả năng tạo token đầu ra nhanh hơn tới 2.5 lần và hiện có giá 10 USD cho một triệu token đầu vào và 50 USD cho một triệu token đầu ra . Mức giá này rẻ hơn ba lần so với chế độ Fast Mode của Opus 4.6 và Opus 4.7, vốn có giá 30 USD / 150 USD . Anthropic đã ngừng cung cấp chế độ Fast Mode cho Opus 4.6 và đang hướng người dùng chuyển sang chế độ Fast Mode cho Opus 4.8 hoặc 4.7 .

Để sử dụng chế độ Fast Mode qua API, các nhà phát triển cần đặt


speed: "fast"

với ID mô hình claude-opus-4-8 và bao gồm tiêu đề beta fast-mode-2026-02-01 . Tính năng này được định giá như một hệ số nhân trên mức giá tiêu chuẩn trong toàn bộ cửa sổ ngữ cảnh đầu vào 200k+ token và có thể kết hợp với hệ số nhân của bộ nhớ đệm prompt và lưu trữ dữ liệu .

Tính khả dụng trên API và định danh mô hình

Mô hình này hiện đã có sẵn thông qua Claude API với bí danh claude-opus-4-8 và được hỗ trợ trong các cấu hình Fast Mode, bộ nhớ đệm prompt và xử lý hàng loạt . Tài liệu API của Anthropic và ghi chú phát hành nền tảng xác nhận rằng khách hàng thuộc các gói Claude Pro, Max, Team và Enterprise có thể truy cập Opus 4.8 ngay lập tức .

Dự án Glasswing và bản phát hành dòng Mythos đang đến gần

Cùng với Opus 4.8, Anthropic đã làm rõ hơn về lộ trình cung cấp rộng rãi các mô hình dòng Mythos. Kể từ ngày 7 tháng 4 năm 2026, Claude Mythos Preview đã bị giới hạn cho khoảng 50 đối tác an ninh mạng phòng thủ thông qua Dự án Glasswing . Năng lực tấn công mạng của mô hình này mạnh đến mức Anthropic đã từ chối phát hành công khai .

Vào ngày 28 tháng 5, Anthropic đã cập nhật thông điệp công khai, cho biết họ có kế hoạch phát hành các mô hình dòng Mythos cho tất cả khách hàng trong vài tuần tới . Đây là mốc thời gian rõ ràng nhất mà công ty đưa ra kể từ khi khởi động Glasswing. Họ cũng tiết lộ vòng gọi vốn Series H trị giá 65 tỷ USD tại mức định giá hậu đầu tư 965 tỷ USD, củng cố thêm thông tin rằng lộ trình thương mại cho các mô hình dòng Mythos đang chuyển từ giai đoạn xem trước nghiên cứu sang khả năng sẵn sàng rộng rãi .

Điều này có ý nghĩa gì đối với nhà phát triển và các đội nhóm

Claude Opus 4.8 là một bản nâng cấp mô hình tăng dần, tạo ra ba khác biệt thực tế cho những người xây dựng:

Nếu bạn muốn chuyển từ Opus 4.7, quá trình chuyển đổi này là một sự thay thế trực tiếp với mức giá giống hệt, cùng các điểm chuẩn lập trình tốt hơn và khả năng tự đánh giá chất lượng code trung thực hơn đáng kể.
Nếu bạn thường xuyên cần đầu ra thông lượng cao và trước đây bị 'choáng' trước mức giá 30 USD/150 USD của chế độ Fast Mode cũ, thì mức giá mới 10 USD/50 USD giúp nó trở nên khả thi cho nhiều tác vụ sản xuất hơn.
Nếu bạn đang lên kế hoạch cho một kiến trúc có thể bao gồm các mô hình dòng Mythos, thông điệp mới từ Anthropic cho thấy giai đoạn xem trước hạn chế đang dần kết thúc và quyền truy cập API chung sẽ sớm đến, mặc dù ngày chính xác và các biện pháp kiểm soát an toàn vẫn chưa được xác nhận.

Đối với các đội nhóm đang cân nhắc có nên chuyển đổi hay không, tín hiệu mạnh mẽ nhất là hãy tự mình kiểm tra Opus 4.8 trực tiếp trên các tác vụ lập trình, tác nhân và tri thức của bạn – đặc biệt là đối với các phiên làm việc dài hạn, nơi mà khả năng tự sửa sai, gắn cờ sự không chắc chắn và điều phối tác nhân phụ song song là quan trọng nhất.

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Tìm kiếm và kiểm chứng sự thật với Studio Global AI

Người ta cũng hỏi

Câu trả lời ngắn gọn cho "Anthropic tung 'át chủ bài' mới: Claude Opus 4.8 mạnh mẽ, trung thực và tiết kiệm hơn hẳn" là gì?

Claude Opus 4.8 chính thức ra mắt ngày 28/05/2026, là bản nâng cấp trực tiếp từ Opus 4.7 với mức giá không đổi: 5 USD cho 1 triệu token đầu vào, 25 USD cho 1 triệu token đầu ra.

Những điểm chính cần xác nhận đầu tiên là gì?

Tôi nên làm gì tiếp theo trong thực tế?

Loạt tính năng mới dành cho nhà phát triển: Điều khiển mức độ nỗ lực (Effort Control) và Luồng công việc động (Dynamic Workflows) cho phép xử lý các tác vụ 'khủng' với hàng trăm tác nhân phụ.

Nguồn

← Back to Trending