studioglobal
トレンドを発見する
レポート公開済み6 ソース

Claude Mythos Preview:公開時期・ベンチマーク・利用可否

公開日として確認できる節目は2026年4月7日。AnthropicはProject Glasswingを同日に発表し、同計画がClaude Mythos Previewによって支えられていると説明している。[12][30] Anthropicの公式ベンチマークでは、GPQA Diamond、Humanity’s Last Exam、BrowseComp、OSWorld VerifiedでClaude Opus 4.6を上回った。ただし、HLEの高スコアには記憶化の可能性という留保も示されている。[16] 一般提供はされていない。Anthropicは、重要なソフトウェア基盤を維持する一部パートナーに、サイバーセキュリティ用途へ限...

17K0
抽象 AI 模型与网络安全界面的编辑插画,代表 Claude Mythos Preview 与关键软件安全
Claude Mythos Preview:2026 年 4 月亮相、跑分领先但暂不公开可用AI 生成的 Claude Mythos Preview 主题编辑配图,表现前沿模型与软件安全场景。
AI プロンプト

Create a landscape editorial hero image for this Studio Global article: Claude Mythos Preview:2026 年 4 月亮相、跑分领先但暂不公开可用. Article summary: Claude Mythos Preview 于 2026 年 4 月 7 日随 Project Glasswing 公开亮相;Anthropic 公布的 GPQA Diamond、Humanity’s Last Exam、BrowseComp、OSWorld Verified 等跑分均高于 Claude Opus 4.6,但它没有 general availability,只向部分网络安全合作伙伴开放。[12][15][16]. Topic tags: ai, anthropic, claude, cybersecurity, software security. Reference image context from search candidates: Reference image 1: visual subject "## InfoQ Software Architects' Newsletter. A monthly overview of things you need to know as an architect or aspiring architect. Live Webinar and Q&A: Architecting for Autonomous Rel" source context "Anthropic Releases Claude Mythos Preview with ... - InfoQ" Reference image 2: visual subject "## InfoQ Software Architects' Newsletter. A monthly overview of things you need to know as an architec

openai.com

まず押さえておきたいのは、Claude Mythos Previewについては「発表された」と「誰でも使える」が別物だという点です。Anthropicは2026年4月7日にProject Glasswingを公表し、その取り組みを支えるモデルとしてClaude Mythos Previewを紹介しました。[12] さらにAnthropicのモデルシステムカード一覧でも、Mythos Previewは「April 2026」に掲載されています。[30]

一方で、Anthropicのシステムカードは、Claude Mythos Previewを一般提供、つまりgeneral availabilityとして公開していないと明記しています。[15] したがって、現時点での正確な見方は「2026年4月に公に披露されたが、通常のClaudeユーザー向けモデルではない」です。

要点だけ先に

  • 公開時期:Project Glasswingの発表日は2026年4月7日。Claude Mythos Previewは同プロジェクトを支えるモデルとして公表された。[12] Anthropicのシステムカード一覧でもApril 2026に位置づけられている。[30]
  • 性能:Anthropicが公開した比較では、Claude Mythos Previewは複数のベンチマークでClaude Opus 4.6を上回っている。[16]
  • 利用可否:一般提供はなし。アクセスは、重要なソフトウェアインフラを維持する一部パートナー組織に限られ、用途もサイバーセキュリティに制限されている。[15]

いつ公開されたのか:節目は2026年4月7日

「Claude Mythos Previewはいつリリースされたのか」と聞く場合、少し整理が必要です。

公に名前が出たという意味では、基準になるのは2026年4月7日です。AnthropicのProject Glasswingページには、同日の発表として、重要ソフトウェアを保護する取り組みProject GlasswingがClaude Mythos Previewによって支えられていると記載されています。[12] また、Anthropicのモデルシステムカード一覧でも、Mythos Previewは2026年4月のモデルとして掲載されています。[30]

ただし、これはClaude.aiで誰でも選べる新モデルが出た、という意味ではありません。Anthropicのシステムカードは、Claude Mythos Previewをgeneral availabilityとしてリリースしていないと説明しています。[15]

何のためのモデルなのか:普通のチャット用ではなく、重要ソフトウェア防衛向け

Project Glasswingは、一般ユーザー向けのチャット製品発表ではありません。Anthropicはこの取り組みを、AI時代に世界の重要なソフトウェアを守るためのイニシアチブとして説明し、Claude Mythos Previewを同社の「most capable model yet」と位置づけています。[12]

この文脈を押さえると、なぜ一般公開されていないのかも見えてきます。Anthropicのシステムカードは、Mythos Previewの能力はソフトウェアの脆弱性発見・修正に役立つ一方で、より高度な悪用手法の設計にも使われ得ると説明しています。そのため、同社は一般提供を見送り、重要なソフトウェアインフラを維持するパートナー組織に限って、サイバーセキュリティ用途でアクセスを提供しているとしています。[15]

Anthropicのレッドチームブログでも、Project Glasswingを通じて限られた重要産業パートナーやオープンソース開発者に初期提供し、同様の能力を持つモデルが広く利用可能になる前に、防御側が重要システムを強化できるようにする狙いが説明されています。[4]

性能はどのくらい強いのか:公式スコアではOpus 4.6を上回る

AnthropicがProject Glasswing関連ページで公開した比較では、Claude Mythos Previewは次のベンチマークでClaude Opus 4.6を上回っています。[16]

ベンチマークClaude Mythos PreviewClaude Opus 4.6
GPQA Diamond94.6%91.3%
Humanity’s Last Exam(ツールなし)56.8%40.0%
Humanity’s Last Exam(ツールあり)64.7%53.1%
BrowseComp86.9%83.7%
OSWorld-Verified79.6%72.7%

Anthropicはさらに、BrowseCompではClaude Mythos PreviewがOpus 4.6より高いスコアを出しつつ、使用トークン数は4.9分の1だったとも説明しています。[16]

この範囲で見る限り、Mythos Previewは高難度の知識・推論タスク、ツール利用、ブラウジング、コンピューター操作環境に関する評価で非常に強いモデルです。Project Glasswingでの位置づけを合わせて考えると、公開資料から最も確実に言えるのは、複雑な推論、ツール使用、ソフトウェア安全性に関わる作業で前線級の能力を持つモデルだということです。[12][16]

ただし、ベンチマークだけで「全面的に最強」とは言えない

スコアは目を引きますが、読み方には注意が必要です。

第一に、上の直接比較はAnthropic自身が公開したベンチマーク結果です。[16] これは無意味だということではありませんが、外部の独立検証がそろっているという話とは区別して見るべきです。

第二に、Anthropic自身もHumanity’s Last Examの結果について留保を示しています。Mythosはlow-effort条件でもHLEで良好に機能しており、これは一定の記憶化を示している可能性がある、と同社は説明しています。[16] つまり、HLEの高スコアは重要な材料ですが、それだけで未知の実務タスクすべてに同じ幅で優位だとまでは言えません。

第三に、安全性・アラインメント関連の評価では、単純にすべての項目で大差をつけているわけではありません。AnthropicのMythos Preview alignment risk updateは、Minimal-LinuxBenchでは設定によってMythosの性能がClaude Opusをわずかに上回る場合も下回る場合もあると述べています。また、SHADE-Arenaでは、長いchain-of-thought転写条件でのstealth success rateが約0%から約3.8%に上昇したとも報告しています。[13]

そのため、より慎重な結論はこうです。Claude Mythos Previewは、Anthropicが公開した主要ベンチマークではClaude Opus 4.6を明確に上回っています。ただし、日常的な日本語文章作成、低遅延の対話、価格、API体験、一般ユーザー向けタスク全般でも同じように優位だと断定するには、公開情報が足りません。[13][16]

一般ユーザーは今使えるのか

現時点で、Claude Mythos Previewを「新しく追加された通常のClaudeモデル」と考えるのは誤りです。Anthropicのシステムカードは、同モデルをgeneral availabilityとしてリリースしていないと明記しています。提供先は、重要なソフトウェアインフラを維持する複数のパートナー組織で、利用条件もサイバーセキュリティ用途に限定されています。[15]

そのため、Claude.ai上で切り替えられるのか、一般APIで呼び出せるのか、料金はいくらか、レイテンシはどうか、コンテキスト長はどの程度か、といった通常の製品情報については、公開資料だけでは十分な答えがありません。少なくともAnthropicが明らかにしている範囲では、Mythos Previewは一般ユーザー向けのClaude新バージョンというより、能力もリスク感度も高い、防御的セキュリティ用途の限定プレビューと見るのが自然です。[12][15]

まとめ

Claude Mythos Previewは、2026年4月にProject Glasswingとともに公表された、重要ソフトウェア防衛向けの限定プレビューモデルです。Anthropicの公式ベンチマークでは、Claude Opus 4.6を複数項目で上回っています。[16]

ただし、Anthropicは同モデルを一般提供していません。アクセスは重要なソフトウェア基盤を守るパートナー向けで、用途もサイバーセキュリティに制限されています。[15]

つまり、普通のClaudeユーザーにとっての結論はシンプルです。Claude Mythos Previewは注目すべき高性能モデルではあるものの、今すぐClaude上で自由に選んで使えるモデルではありません。

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Studio Global AIで検索して事実確認

重要なポイント

  • 公開日として確認できる節目は2026年4月7日。AnthropicはProject Glasswingを同日に発表し、同計画がClaude Mythos Previewによって支えられていると説明している。[12][30]
  • Anthropicの公式ベンチマークでは、GPQA Diamond、Humanity’s Last Exam、BrowseComp、OSWorld VerifiedでClaude Opus 4.6を上回った。ただし、HLEの高スコアには記憶化の可能性という留保も示されている。[16]
  • 一般提供はされていない。Anthropicは、重要なソフトウェア基盤を維持する一部パートナーに、サイバーセキュリティ用途へ限定してアクセスを提供している。[15]

人々も尋ねます

「Claude Mythos Preview:公開時期・ベンチマーク・利用可否」の短い答えは何ですか?

公開日として確認できる節目は2026年4月7日。AnthropicはProject Glasswingを同日に発表し、同計画がClaude Mythos Previewによって支えられていると説明している。[12][30]

最初に検証する重要なポイントは何ですか?

公開日として確認できる節目は2026年4月7日。AnthropicはProject Glasswingを同日に発表し、同計画がClaude Mythos Previewによって支えられていると説明している。[12][30] Anthropicの公式ベンチマークでは、GPQA Diamond、Humanity’s Last Exam、BrowseComp、OSWorld VerifiedでClaude Opus 4.6を上回った。ただし、HLEの高スコアには記憶化の可能性という留保も示されている。[16]

次の実践では何をすればいいでしょうか?

一般提供はされていない。Anthropicは、重要なソフトウェア基盤を維持する一部パートナーに、サイバーセキュリティ用途へ限定してアクセスを提供している。[15]

次にどの関連トピックを検討すればよいでしょうか?

別の角度からの引用や追加の引用については、「Claude Opus 4.7、GPT-5.5、DeepSeek V4、Kimi K2.6比較:2026年ベンチマークの結論」に進みます。

関連ページを開く

これを何と比較すればいいでしょうか?

この回答を「DeepSeek V4を技術面から読む:100万トークン、MoE、API移行の要点」と照合してください。

関連ページを開く

研究を続けてください

研究に関する会話

あなた

リサーチクエスチョン

克劳德·米索斯什么时候发布?实力如何?

Studio Global AI32 ソース

引用された回答

Bottom line

如果你说的是 Anthropic 的 Claude Mythos Preview,它的官方公开亮相时间是 2026 年 4 月 7 日,随 Project Glasswing 一起公布;Anthropic 的系统卡目录也把它标成 2026 年 4 月发布。[10][29]
就官方已公开的信息看,它非常强,尤其在高难推理、工具使用、浏览/电脑操作和安全相关软件任务上,公布分数整体高于 Claude Opus 4.6。[23][26]
但它不是面向所有用户的一般可用版,而是受限 preview,只开放给部分合作伙伴,并限制在网络安全场景使用。[23]

Key findings

  • Mythos Preview 是 Anthropic 在 2026 年 4 月公开的受限预览模型,不是大众开放产品。[10][23][29]
  • Anthropic 将它描述为其“most capable model yet”,并把它放在 Project Glasswing 这个“关键软件安全”项目中发布。[10]
  • 官方 benchmark 中,Mythos Preview 对 Opus 4.6 全面领先:GPQA Diamond 94.6% vs 91.3%,Humanity’s Last Exam 无工具 56.8% vs 40.0%,带工具 64.7% vs 53.1%,BrowseComp 86.9% vs 83.7%,OSWorld-Verified 79.6% vs 72.7%。[26]
  • Anthropic 也给了保留意见:Mythos 在 Humanity’s Last Exam 上“低 effort 仍表现很好”可能意味着存在一定记忆化因素,因此高分不应被简单等同于所有真实场景都同幅度领先。[26]

Confirmed facts

  • 官方公告显示,Project Glasswing 于 2026 年 4 月 7 日发布,并说明该项目由 Claude Mythos Preview 提供支持。[10]
  • Anthropic 的系统卡目录把 Mythos Preview 列为 “April 2026”。[29]
  • Anthropic 明确表示没有把 Mythos Preview 做一般公开发布,而是仅向部分维护重要软件基础设施的合作伙伴开放,并限制用途为网络安全。[23]
  • 按 Anthropic 公开分数,Mythos Preview 在多项关键 benchmark 上超过 Claude Opus 4.6。[26]

What remains inference

  • 如果你说的“实力”是日常聊天、写作、中文表现、稳定性、延迟和价格的综合体验,现有公开证据还不够完整;目前最强证据主要集中在高难推理、软件理解、工具调用和安全相关能力。
  • 从它的发布方式看,它更像“高能力但高风险、因此受限”的 frontier preview,而不是成熟的大众产品。

What the evidence suggests

  • 如果只看 Anthropic 官方口径,Mythos Preview 可以视为当时 Claude 体系里非常靠前、甚至最前沿的一档模型。[10][23][26]
  • 它的优势看起来尤其集中在需要深度推理、调用工具、浏览信息、操作计算机环境,以及理解和修改复杂软件的任务上。[23][26]
  • 对普通用户来说,当前更重要的结论不是“能不能用到最强 Claude”,而是“这个模型现在并不面向你直接开放”。[23]

Conflicting evidence or uncertainty

  • 目前直接证据几乎都来自 Anthropic 官方材料,所以“官方内部口径一致”这一点较强,但“外部独立复现已经充分验证”这一点还不够强。[10][23][26]
  • 官方风险更新摘要提到,在某些内部测试里,Mythos 的表现只是略高于或略低于 Claude Opus,取决于设置;这说明它并不是在所有子任务上都稳定大幅领先。[22]
  • 官方自己也承认,部分高分可能受记忆化影响。[26]

Open questions

  • Mythos Preview 何时会从受限 preview 变成一般可用产品,目前我没看到明确时间表。
  • 它的价格、API 可用性、延迟、上下文窗口等面向开发者的完整信息,公开证据还不充分。Insufficient evidence.

Sources worth trusting most

  • Project Glasswing 官方公告:确认首次公开时间和官方定位。[10]
  • Mythos Preview System Card:确认它不是一般公开版,而是受限开放。[23]
  • Glasswing benchmark 页面:看 Mythos 与 Opus 4.6 的直接分数对比和 caveat。[26]
  • Anthropic 系统卡目录:交叉确认发布时间属于 2026 年 4 月。[29]

Recommended next step

如果你愿意,我下一条可以直接帮你做一个“Claude Mythos Preview vs Claude Opus 4.7 vs GPT-5 vs Gemini 2.5 Pro”的简明对比,重点看:

  • 代码能力
  • 推理能力
  • Agent 能力
  • 普通用户是否能用
  • 性价比

Summary

简短说:Claude Mythos Preview 是 2026 年 4 月初公开的受限预览模型,官方公开亮相点是 4 月 7 日。[10][29]
按 Anthropic 公布的数据,它很强,而且在多项 benchmark 上超过了 Claude Opus 4.6。[26]
但它目前不是普通用户随便可用的常规 Claude,而是带使用限制的高能力预览版。[23]

情報源

  • [4] Claude Mythos Preview \ red.anthropic.comred.anthropic.com

    But the transitional period may be tumultuous regardless. By releasing this model initially to a limited group of critical industry partners and open source developers with Project Glasswing, we aim to enable defenders to begin securing the most important s...

  • [12] Project Glasswing - Anthropicanthropic.com

    Skip to footer Try Claude Claude Project Glasswing Claude Project Glasswing Claude Project Glasswing An initiative to secure the world’s most critical software with early access to frontier AI Read the announcement Announcements NEW Project Glasswing Apr 7,...

  • [13] [PDF] Alignment Risk Update: Claude Mythos Preview - Anthropicanthropic.com

    We have two “secret side task” evaluations that involve secret-keeping: SHADE-Arena, and Minimal-LinuxBench (the latter is non-public, but we believe it better represents our internal usage distribution). The most notable change in performance compared with...

  • [15] Claude Mythos Preview System Cardanthropic.com

    and fixing vulnerabilities in software code) and offensive purposes (designing sophisticated ways to exploit those vulnerabilities). It is largely due to these capabilities that we have made the decision not to release Claude Mythos Preview for general avai...

  • [16] Project Glasswing: Securing critical software for the AI era - Anthropicanthropic.com

    GPQA Diamond Mythos Preview 94.6% Opus 4.6 91.3% Humanity’s Last Exam Mythos Preview without tools 56.8% Opus 4.6 without tools 40.0% Mythos Preview with tools 64.7% Opus 4.6 with tools 53.1% Humanity’s Last Exam: We have found Mythos still performs well on...

  • [30] Model system cards - Anthropicanthropic.com

    Model Date System card --- Mythos Preview April 2026 Read system card Claude Sonnet 4.6 February 2026 Read system card Claude Opus 4.6 February 2026 Read system card Claude Opus 4.5 November 2025 Read system card Claude Haiku 4.5 October 2025 Read system ca...

Claude Mythos Preview:公開時期・ベンチマーク・利用可否 | 深い研究 | Studio Global