studioglobal
热门发现
报告已发布6 来源

Claude Mythos Preview ra mắt khi nào, mạnh đến đâu và ai có thể dùng?

Claude Mythos Preview xuất hiện công khai ngày 7/4/2026 trong Project Glasswing; Anthropic cũng xếp model này vào nhóm April 2026 trong danh mục system card.[12][30] Theo benchmark do Anthropic công bố, Mythos Preview cao hơn Claude Opus 4.6 ở GPQA Diamond, Humanity’s Last Exam, BrowseComp và OSWorld Verified.[16] Đ...

17K0
抽象 AI 模型与网络安全界面的编辑插画,代表 Claude Mythos Preview 与关键软件安全
Claude Mythos Preview:2026 年 4 月亮相、跑分领先但暂不公开可用AI 生成的 Claude Mythos Preview 主题编辑配图,表现前沿模型与软件安全场景。
AI 提示

Create a landscape editorial hero image for this Studio Global article: Claude Mythos Preview:2026 年 4 月亮相、跑分领先但暂不公开可用. Article summary: Claude Mythos Preview 于 2026 年 4 月 7 日随 Project Glasswing 公开亮相;Anthropic 公布的 GPQA Diamond、Humanity’s Last Exam、BrowseComp、OSWorld Verified 等跑分均高于 Claude Opus 4.6,但它没有 general availability,只向部分网络安全合作伙伴开放。[12][15][16]. Topic tags: ai, anthropic, claude, cybersecurity, software security. Reference image context from search candidates: Reference image 1: visual subject "## InfoQ Software Architects' Newsletter. A monthly overview of things you need to know as an architect or aspiring architect. Live Webinar and Q&A: Architecting for Autonomous Rel" source context "Anthropic Releases Claude Mythos Preview with ... - InfoQ" Reference image 2: visual subject "## InfoQ Software Architects' Newsletter. A monthly overview of things you need to know as an architec

openai.com

Điều dễ gây nhầm lẫn nhất về Claude Mythos Preview là chữ Preview. Model này đã được Anthropic công bố công khai, nhưng không phải một lựa chọn Claude phổ thông mà người dùng có thể vào ứng dụng rồi bật lên dùng như các model thông thường. Theo tài liệu của Anthropic, Mythos Preview xuất hiện cùng Project Glasswing vào ngày 7/4/2026; đây là sáng kiến dùng AI tiền tuyến để bảo vệ phần mềm trọng yếu, được Anthropic nói là do Claude Mythos Preview hỗ trợ.[12][30] Đồng thời, system card của Anthropic nêu rõ công ty không phát hành Mythos Preview dưới dạng general availability, tức phát hành rộng rãi cho mọi người dùng.[15]

Tóm tắt nhanh

  • Mốc công bố: ngày 7/4/2026, khi Anthropic giới thiệu Project Glasswing; danh mục system card cũng ghi Mythos Preview là model tháng 4/2026.[12][30]
  • Năng lực: trong các bài benchmark do Anthropic công bố, Claude Mythos Preview đều vượt Claude Opus 4.6 ở GPQA Diamond, Humanity’s Last Exam, BrowseComp và OSWorld-Verified.[16]
  • Khả năng sử dụng: chưa mở rộng cho người dùng phổ thông. Anthropic nói quyền truy cập được cấp cho một số tổ chức đối tác duy trì hạ tầng phần mềm quan trọng và bị giới hạn cho mục đích an ninh mạng.[15]

Claude Mythos Preview được công bố khi nào?

Nếu hỏi “ra mắt khi nào”, cần tách hai nghĩa.

Nghĩa thứ nhất là được công bố công khai. Trang Project Glasswing của Anthropic ghi thông báo ngày 7/4/2026 và mô tả sáng kiến này được hỗ trợ bởi Claude Mythos Preview.[12] Danh mục system card của Anthropic cũng liệt kê Mythos Preview ở mốc April 2026.[30] Vì vậy, cách nói chính xác là: Claude Mythos Preview xuất hiện công khai vào tháng 4/2026, gắn với Project Glasswing.

Nghĩa thứ hai là phát hành rộng rãi cho mọi người dùng. Với nghĩa này, câu trả lời hiện là không. Anthropic nói rõ họ không phát hành Claude Mythos Preview dưới dạng general availability.[15]

Đây là model gì?

Project Glasswing không phải một trang giới thiệu chatbot thông thường. Anthropic mô tả đây là sáng kiến nhằm bảo vệ phần mềm trọng yếu của thế giới trong kỷ nguyên AI, và gọi Claude Mythos Preview là model mạnh nhất của họ tại thời điểm công bố sáng kiến này.[12]

Cách định vị đó cũng giải thích vì sao Mythos Preview bị giới hạn truy cập. Theo system card, các năng lực của model có thể dùng để tìm và sửa lỗ hổng phần mềm, nhưng cũng có thể bị lạm dụng để thiết kế cách khai thác lỗ hổng tinh vi hơn. Chính vì vậy, Anthropic quyết định không phát hành Mythos Preview rộng rãi.[15]

Bài viết từ nhóm red team của Anthropic cũng nêu cùng bối cảnh: Mythos Preview ban đầu được đưa tới một nhóm giới hạn gồm đối tác trong các ngành trọng yếu và nhà phát triển mã nguồn mở thông qua Project Glasswing, với mục tiêu giúp bên phòng thủ gia cố các hệ thống quan trọng trước khi những model có năng lực tương tự trở nên phổ biến hơn.[4]

Điểm benchmark: cao hơn Claude Opus 4.6 trong so sánh chính thức

Trong bảng so sánh trực tiếp do Anthropic công bố trên trang Glasswing, Claude Mythos Preview đạt điểm cao hơn Claude Opus 4.6 ở các benchmark được liệt kê:[16]

BenchmarkClaude Mythos PreviewClaude Opus 4.6
GPQA Diamond94,6%91,3%
Humanity’s Last Exam, không dùng công cụ56,8%40,0%
Humanity’s Last Exam, có dùng công cụ64,7%53,1%
BrowseComp86,9%83,7%
OSWorld-Verified79,6%72,7%

Anthropic còn cho biết ở BrowseComp, Claude Mythos Preview không chỉ có điểm cao hơn Opus 4.6 mà còn dùng ít token hơn 4,9 lần.[16]

Nếu hiểu “mạnh” theo các nhóm nhiệm vụ như trả lời câu hỏi khó, sử dụng công cụ, duyệt thông tin và thao tác trong môi trường máy tính, dữ liệu công khai hiện có cho thấy Mythos Preview là một model rất mạnh. Khi đặt cạnh vai trò của nó trong Project Glasswing, bằng chứng được công bố ủng hộ nhận định rằng model này có năng lực tiền tuyến ở các tác vụ phức tạp liên quan tới suy luận, công cụ và bảo mật phần mềm.[12][16]

Vì sao không nên chỉ nhìn vào điểm số?

Các con số trên rất ấn tượng, nhưng không nên diễn giải thành “Mythos Preview chắc chắn tốt hơn ở mọi tình huống thực tế”. Có ba điểm cần thận trọng.

Thứ nhất, các điểm so sánh trực tiếp nêu ở trên đến từ tài liệu do Anthropic công bố, chưa phải kết quả tái lập độc lập từ bên ngoài trong phần tư liệu được dẫn ở đây.[16] Điều này không đồng nghĩa điểm số sai, nhưng nên xem chúng là kết quả đánh giá chính thức từ nhà phát triển.

Thứ hai, Anthropic tự đưa ra lưu ý với điểm Humanity’s Last Exam: Mythos vẫn làm tốt trong điều kiện low-effort, điều này có thể cho thấy một mức độ ghi nhớ nhất định.[16] Vì vậy, điểm HLE nói lên hiệu năng trên benchmark đó, nhưng không đủ để kết luận model sẽ dẫn trước với cùng biên độ ở mọi tác vụ hoàn toàn mới.

Thứ ba, tài liệu cập nhật rủi ro alignment cho thấy năng lực và hành vi an toàn không phải lúc nào cũng vượt trội theo một chiều đơn giản. Anthropic nói trong Minimal-LinuxBench, Mythos có thể nhỉnh hơn hoặc thấp hơn Claude Opus một chút tùy thiết lập; cùng bản tóm tắt cũng nêu tỷ lệ stealth success trong SHADE-Arena với bản ghi chuỗi suy luận dài tăng từ khoảng 0% lên khoảng 3,8%.[13]

Cách đọc cân bằng hơn là: Claude Mythos Preview vượt Claude Opus 4.6 rõ rệt trong các benchmark chính mà Anthropic công bố, nhưng bằng chứng công khai chưa đủ để khẳng định nó cũng vượt trội toàn diện ở viết tiếng Việt hằng ngày, độ trễ, chi phí, trải nghiệm sản phẩm hay mọi tác vụ phổ thông khác.[13][16]

Người dùng phổ thông có dùng được không?

Hiện không nên xem Claude Mythos Preview là một phiên bản Claude đại chúng đã lên kệ. System card của Anthropic viết rằng model này không được phát hành general availability; quyền truy cập được cấp cho một số tổ chức đối tác duy trì hạ tầng phần mềm quan trọng, kèm điều khoản giới hạn mục đích sử dụng trong an ninh mạng.[15]

Điều đó cũng có nghĩa: nếu bạn muốn biết có thể chọn Mythos Preview trong Claude hay không, API thông thường có gọi được không, giá bao nhiêu, độ trễ thế nào, cửa sổ ngữ cảnh lớn đến đâu, thì tài liệu công khai hiện chưa đưa ra một câu trả lời sản phẩm đầy đủ. Dựa trên những gì Anthropic đã nói, Mythos Preview giống một model tiền tuyến có năng lực cao nhưng nhạy cảm, dành cho công việc phòng thủ an ninh phần mềm, hơn là một model Claude mới cho số đông dùng ngay.[12][15]

Kết luận

Claude Mythos Preview có thể được mô tả ngắn gọn như sau: model preview bị giới hạn, xuất hiện công khai vào tháng 4/2026 cùng Project Glasswing và tập trung vào an ninh phần mềm trọng yếu. Các benchmark do Anthropic công bố cho thấy nó vượt Claude Opus 4.6 ở nhiều chỉ số, nhưng Anthropic cũng nói rõ chưa phát hành rộng rãi và chỉ cấp quyền trong bối cảnh đối tác an ninh mạng.[12][15][16][30]

Với người dùng phổ thông, kết luận quan trọng nhất không phải là có nên chuyển sang Mythos ngay hay không, mà là: hiện tại đây chưa phải một model Claude thông thường có thể tự chọn để sử dụng.

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

使用 Studio Global AI 搜索并核查事实

要点

  • Claude Mythos Preview xuất hiện công khai ngày 7/4/2026 trong Project Glasswing; Anthropic cũng xếp model này vào nhóm April 2026 trong danh mục system card.[12][30]
  • Theo benchmark do Anthropic công bố, Mythos Preview cao hơn Claude Opus 4.6 ở GPQA Diamond, Humanity’s Last Exam, BrowseComp và OSWorld Verified.[16]
  • Đây không phải model mở rộng cho mọi người dùng: Anthropic nói chưa phát hành Mythos Preview dưới dạng general availability và chỉ cấp quyền cho một số đối tác trong lĩnh vực an ninh mạng.[15]

人们还问

“Claude Mythos Preview ra mắt khi nào, mạnh đến đâu và ai có thể dùng?”的简短答案是什么?

Claude Mythos Preview xuất hiện công khai ngày 7/4/2026 trong Project Glasswing; Anthropic cũng xếp model này vào nhóm April 2026 trong danh mục system card.[12][30]

首先要验证的关键点是什么?

Claude Mythos Preview xuất hiện công khai ngày 7/4/2026 trong Project Glasswing; Anthropic cũng xếp model này vào nhóm April 2026 trong danh mục system card.[12][30] Theo benchmark do Anthropic công bố, Mythos Preview cao hơn Claude Opus 4.6 ở GPQA Diamond, Humanity’s Last Exam, BrowseComp và OSWorld Verified.[16]

接下来在实践中我应该做什么?

Đây không phải model mở rộng cho mọi người dùng: Anthropic nói chưa phát hành Mythos Preview dưới dạng general availability và chỉ cấp quyền cho một số đối tác trong lĩnh vực an ninh mạng.[15]

接下来我应该探索哪个相关主题?

继续“Claude Opus 4.7、GPT-5.5、DeepSeek V4 与 Kimi K2.6:2026 基准对比与选型结论”以获得另一个角度和额外的引用。

打开相关页面

我应该将其与什么进行比较?

对照“DeepSeek V4 工程解析:1M 上下文、MoE 与 API 迁移要点”交叉检查此答案。

打开相关页面

继续你的研究

研究对话

研究问题

克劳德·米索斯什么时候发布?实力如何?

Studio Global AI32 来源

引用的答案

Bottom line

如果你说的是 Anthropic 的 Claude Mythos Preview,它的官方公开亮相时间是 2026 年 4 月 7 日,随 Project Glasswing 一起公布;Anthropic 的系统卡目录也把它标成 2026 年 4 月发布。[10][29]
就官方已公开的信息看,它非常强,尤其在高难推理、工具使用、浏览/电脑操作和安全相关软件任务上,公布分数整体高于 Claude Opus 4.6。[23][26]
但它不是面向所有用户的一般可用版,而是受限 preview,只开放给部分合作伙伴,并限制在网络安全场景使用。[23]

Key findings

  • Mythos Preview 是 Anthropic 在 2026 年 4 月公开的受限预览模型,不是大众开放产品。[10][23][29]
  • Anthropic 将它描述为其“most capable model yet”,并把它放在 Project Glasswing 这个“关键软件安全”项目中发布。[10]
  • 官方 benchmark 中,Mythos Preview 对 Opus 4.6 全面领先:GPQA Diamond 94.6% vs 91.3%,Humanity’s Last Exam 无工具 56.8% vs 40.0%,带工具 64.7% vs 53.1%,BrowseComp 86.9% vs 83.7%,OSWorld-Verified 79.6% vs 72.7%。[26]
  • Anthropic 也给了保留意见:Mythos 在 Humanity’s Last Exam 上“低 effort 仍表现很好”可能意味着存在一定记忆化因素,因此高分不应被简单等同于所有真实场景都同幅度领先。[26]

Confirmed facts

  • 官方公告显示,Project Glasswing 于 2026 年 4 月 7 日发布,并说明该项目由 Claude Mythos Preview 提供支持。[10]
  • Anthropic 的系统卡目录把 Mythos Preview 列为 “April 2026”。[29]
  • Anthropic 明确表示没有把 Mythos Preview 做一般公开发布,而是仅向部分维护重要软件基础设施的合作伙伴开放,并限制用途为网络安全。[23]
  • 按 Anthropic 公开分数,Mythos Preview 在多项关键 benchmark 上超过 Claude Opus 4.6。[26]

What remains inference

  • 如果你说的“实力”是日常聊天、写作、中文表现、稳定性、延迟和价格的综合体验,现有公开证据还不够完整;目前最强证据主要集中在高难推理、软件理解、工具调用和安全相关能力。
  • 从它的发布方式看,它更像“高能力但高风险、因此受限”的 frontier preview,而不是成熟的大众产品。

What the evidence suggests

  • 如果只看 Anthropic 官方口径,Mythos Preview 可以视为当时 Claude 体系里非常靠前、甚至最前沿的一档模型。[10][23][26]
  • 它的优势看起来尤其集中在需要深度推理、调用工具、浏览信息、操作计算机环境,以及理解和修改复杂软件的任务上。[23][26]
  • 对普通用户来说,当前更重要的结论不是“能不能用到最强 Claude”,而是“这个模型现在并不面向你直接开放”。[23]

Conflicting evidence or uncertainty

  • 目前直接证据几乎都来自 Anthropic 官方材料,所以“官方内部口径一致”这一点较强,但“外部独立复现已经充分验证”这一点还不够强。[10][23][26]
  • 官方风险更新摘要提到,在某些内部测试里,Mythos 的表现只是略高于或略低于 Claude Opus,取决于设置;这说明它并不是在所有子任务上都稳定大幅领先。[22]
  • 官方自己也承认,部分高分可能受记忆化影响。[26]

Open questions

  • Mythos Preview 何时会从受限 preview 变成一般可用产品,目前我没看到明确时间表。
  • 它的价格、API 可用性、延迟、上下文窗口等面向开发者的完整信息,公开证据还不充分。Insufficient evidence.

Sources worth trusting most

  • Project Glasswing 官方公告:确认首次公开时间和官方定位。[10]
  • Mythos Preview System Card:确认它不是一般公开版,而是受限开放。[23]
  • Glasswing benchmark 页面:看 Mythos 与 Opus 4.6 的直接分数对比和 caveat。[26]
  • Anthropic 系统卡目录:交叉确认发布时间属于 2026 年 4 月。[29]

Recommended next step

如果你愿意,我下一条可以直接帮你做一个“Claude Mythos Preview vs Claude Opus 4.7 vs GPT-5 vs Gemini 2.5 Pro”的简明对比,重点看:

  • 代码能力
  • 推理能力
  • Agent 能力
  • 普通用户是否能用
  • 性价比

Summary

简短说:Claude Mythos Preview 是 2026 年 4 月初公开的受限预览模型,官方公开亮相点是 4 月 7 日。[10][29]
按 Anthropic 公布的数据,它很强,而且在多项 benchmark 上超过了 Claude Opus 4.6。[26]
但它目前不是普通用户随便可用的常规 Claude,而是带使用限制的高能力预览版。[23]

来源

  • [4] Claude Mythos Preview \ red.anthropic.comred.anthropic.com

    But the transitional period may be tumultuous regardless. By releasing this model initially to a limited group of critical industry partners and open source developers with Project Glasswing, we aim to enable defenders to begin securing the most important s...

  • [12] Project Glasswing - Anthropicanthropic.com

    Skip to footer Try Claude Claude Project Glasswing Claude Project Glasswing Claude Project Glasswing An initiative to secure the world’s most critical software with early access to frontier AI Read the announcement Announcements NEW Project Glasswing Apr 7,...

  • [13] [PDF] Alignment Risk Update: Claude Mythos Preview - Anthropicanthropic.com

    We have two “secret side task” evaluations that involve secret-keeping: SHADE-Arena, and Minimal-LinuxBench (the latter is non-public, but we believe it better represents our internal usage distribution). The most notable change in performance compared with...

  • [15] Claude Mythos Preview System Cardanthropic.com

    and fixing vulnerabilities in software code) and offensive purposes (designing sophisticated ways to exploit those vulnerabilities). It is largely due to these capabilities that we have made the decision not to release Claude Mythos Preview for general avai...

  • [16] Project Glasswing: Securing critical software for the AI era - Anthropicanthropic.com

    GPQA Diamond Mythos Preview 94.6% Opus 4.6 91.3% Humanity’s Last Exam Mythos Preview without tools 56.8% Opus 4.6 without tools 40.0% Mythos Preview with tools 64.7% Opus 4.6 with tools 53.1% Humanity’s Last Exam: We have found Mythos still performs well on...

  • [30] Model system cards - Anthropicanthropic.com

    Model Date System card --- Mythos Preview April 2026 Read system card Claude Sonnet 4.6 February 2026 Read system card Claude Opus 4.6 February 2026 Read system card Claude Opus 4.5 November 2025 Read system card Claude Haiku 4.5 October 2025 Read system ca...