Câu trả lờiĐã xuất bản2 tháng trướcLast edited tháng trước26 nguồn

Claude Opus 4.8: Cách Anthropic dạy AI thừa nhận những điều nó không biết

Claude Opus 4.8 ra mắt ngày 28/5/2026, là mô hình chủ lực mới của Anthropic, được thiết kế để nêu bật những điểm không chắc chắn và giảm thiểu các tuyên bố vô căn cứ, với ít lỗi mã không được gắn cờ hơn gấp 4 lần so v... Một căng thẳng chính: Anthropic ghi nhận các mô hình Opus trước đó nhận ra mình đang bị đánh giá...

Tìm kiếm và kiểm chứng sự thật với Studio Global AI Duyệt thêm trang xu hướng

Claude Opus 4.8 AI honesty concept with a model self-reflecting on its own uncertainty — What is Anthropic's Claude Opus 4.8, how does it improve AI honesty by teaching the model to admit when it lacks information, what near-perfAnthropic's Claude Opus 4.8 is trained to flag what it doesn't know rather than guess—a shift toward AI that admits uncertainty.
Prompt AI
Create a landscape editorial hero image for this Studio Global article: What is Anthropic's Claude Opus 4.8, how does it improve AI honesty by teaching the model to admit when it lacks information, what near-perf. Article summary: ## What Is Claude Opus 4.8. Topic tags: general, general web, user generated, education. Reference image context from search candidates: Reference image 1: visual subject "The image features bold white text on a black background with a red block highlighting "OPUS 4.8" and includes a small handwritten note pointing to "PLUS MORE!" above the main text" Reference image 2: visual subject "A person with a backpack walking past a large illuminated sign that reads "Code w/ Claude," likely referencing the launch or review of Claude Opus 4.8." Style: premium digital editorial illustration, source-backed research mood, clean composition, high detail, modern web publicat
openai.com

Anthropic đã phát hành Claude Opus 4.8 vào ngày 28 tháng 5 năm 2026, định vị đây là sự thay thế trực tiếp cho Opus 4.7 với cùng mức giá: 5 đô la cho một triệu token đầu vào và 25 đô la cho một triệu token đầu ra . Được công ty mô tả là có "khả năng phán đoán sắc bén hơn, trung thực hơn về tiến độ của mình và khả năng làm việc độc lập lâu hơn so với các phiên bản tiền nhiệm" , mô hình này ra mắt với sự nhấn mạnh rõ ràng vào tính trung thực cùng với điểm chuẩn cạnh tranh - 88,6% trên SWE-bench Verified, 93,6% trên GPQA Diamond và 74,6% trên Terminal-Bench 2.1 .

Cách Opus 4.8 cải thiện tính trung thực của AI

Anthropic coi tính trung thực là một tính năng cốt lõi trong Opus 4.8, huấn luyện mô hình nêu bật những điểm không chắc chắn về công việc của chính nó và giảm thiểu các tuyên bố vô căn cứ . Trên thực tế, những người thử nghiệm ban đầu báo cáo rằng mô hình này "có nhiều khả năng nêu bật những điểm không chắc chắn về công việc của mình và ít có khả năng đưa ra các tuyên bố không có căn cứ hơn" .

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Tìm kiếm và kiểm chứng sự thật với Studio Global AI

Người ta cũng hỏi

Câu trả lời ngắn gọn cho "Claude Opus 4.8: Cách Anthropic dạy AI thừa nhận những điều nó không biết" là gì?

Những điểm chính cần xác nhận đầu tiên là gì?

Tôi nên làm gì tiếp theo trong thực tế?

Opus 4.8 đạt 88,6% trên SWE bench Verified với mức giá không đổi so với Opus 4.7, trong khi mô hình mạnh hơn là Claude Mythos Preview (93,9%) vẫn bị giới hạn cho 60 đối tác đã được thẩm định và sẽ không được phát hành...

Claude Opus 4.8: Cách Anthropic dạy AI thừa nhận những điều nó không biết

Cách Opus 4.8 cải thiện tính trung thực của AI

Search, cite, and publish your own answer

Người ta cũng hỏi

Câu trả lời ngắn gọn cho "Claude Opus 4.8: Cách Anthropic dạy AI thừa nhận những điều nó không biết" là gì?

Những điểm chính cần xác nhận đầu tiên là gì?

Tôi nên làm gì tiếp theo trong thực tế?

Nguồn

Điểm trung thực gần như hoàn hảo trong các câu hỏi lập trình

Vấn đề 'nhận thức đang bị đánh giá'

Các cải thiện điểm chuẩn và khả năng mới

Opus 4.8 so với Opus 4.7 và Mythos Preview

Điều này có ý nghĩa gì đối với các nhà phát triển