studioglobal
ค้นพบเทรนด์
รายงานเผยแพร่แล้ว6 แหล่งที่มา

Claude Mythos Preview: เปิดตัวเมษายน 2026 คะแนนแรงกว่า Opus 4.6 แต่ยังไม่เปิดให้ใช้ทั่วไป

Claude Mythos Preview ปรากฏต่อสาธารณะพร้อม Project Glasswing เมื่อ 7 เมษายน 2026 และอยู่ในหมวด April 2026 ของระบบการ์ดโมเดล Anthropic [12][30] คะแนน benchmark ที่ Anthropic เปิดเผยสูงกว่า Claude Opus 4.6 ใน GPQA Diamond, Humanity’s Last Exam, BrowseComp และ OSWorld Verified [16] โมเดลนี้ยังไม่ใช่รุ่นที่เปิดให้ใช้งาน...

17K0
抽象 AI 模型与网络安全界面的编辑插画,代表 Claude Mythos Preview 与关键软件安全
Claude Mythos Preview:2026 年 4 月亮相、跑分领先但暂不公开可用AI 生成的 Claude Mythos Preview 主题编辑配图,表现前沿模型与软件安全场景。
AI พรอมต์

Create a landscape editorial hero image for this Studio Global article: Claude Mythos Preview:2026 年 4 月亮相、跑分领先但暂不公开可用. Article summary: Claude Mythos Preview 于 2026 年 4 月 7 日随 Project Glasswing 公开亮相;Anthropic 公布的 GPQA Diamond、Humanity’s Last Exam、BrowseComp、OSWorld Verified 等跑分均高于 Claude Opus 4.6,但它没有 general availability,只向部分网络安全合作伙伴开放。[12][15][16]. Topic tags: ai, anthropic, claude, cybersecurity, software security. Reference image context from search candidates: Reference image 1: visual subject "## InfoQ Software Architects' Newsletter. A monthly overview of things you need to know as an architect or aspiring architect. Live Webinar and Q&A: Architecting for Autonomous Rel" source context "Anthropic Releases Claude Mythos Preview with ... - InfoQ" Reference image 2: visual subject "## InfoQ Software Architects' Newsletter. A monthly overview of things you need to know as an architec

openai.com

ประเด็นสำคัญของ Claude Mythos Preview คืออย่าเพิ่งมองว่าเป็น “Claude รุ่นใหม่ที่ทุกคนกดเลือกใช้ได้” แม้ Anthropic จะเปิดเผยชื่อโมเดลนี้ต่อสาธารณะแล้ว แต่เอกสารของบริษัทระบุชัดว่าไม่ได้ปล่อยเป็น general availability หรือการเปิดใช้งานทั่วไปสำหรับผู้ใช้วงกว้าง [15]

ในภาพรวม Mythos Preview เป็นโมเดลพรีวิวที่มาพร้อม Project Glasswing โครงการที่ Anthropic อธิบายว่าใช้ AI แนวหน้าเพื่อช่วยปกป้องซอฟต์แวร์สำคัญของโลก โดยเปิดตัวสู่สาธารณะเมื่อวันที่ 7 เมษายน 2026 [12] รายชื่อ model system cards ของ Anthropic ก็จัด Mythos Preview ไว้ในเดือน April 2026 เช่นกัน [30]

สรุปสั้น ๆ ก่อน

  • วันเปิดตัวต่อสาธารณะ: 7 เมษายน 2026 ผ่าน Project Glasswing; ในหน้ารวม system cards ของ Anthropic ระบุ Mythos Preview อยู่ใน April 2026 [12][30]
  • ความสามารถตามคะแนนที่เปิดเผย: ใน benchmark ที่ Anthropic นำมาเทียบโดยตรง Mythos Preview ทำคะแนนสูงกว่า Claude Opus 4.6 ในหลายชุดทดสอบ เช่น GPQA Diamond, Humanity’s Last Exam, BrowseComp และ OSWorld-Verified [16]
  • สถานะการใช้งาน: ยังไม่เปิดให้ผู้ใช้ทั่วไปใช้งาน Anthropic ระบุว่าให้สิทธิ์เข้าถึงแก่พันธมิตรบางองค์กรที่ดูแลโครงสร้างพื้นฐานซอฟต์แวร์สำคัญ และมีเงื่อนไขจำกัดการใช้เฉพาะงานไซเบอร์ซีเคียวริตี้ [15]

เปิดตัวเมื่อไร: ต้องแยก “เปิดเผย” กับ “เปิดให้ใช้”

ถ้าถามว่า Claude Mythos Preview “ออกเมื่อไร” คำตอบขึ้นอยู่กับว่าหมายถึงอะไร

ความหมายแรกคือ เปิดเผยต่อสาธารณะ ในกรณีนี้วันที่สำคัญคือ 7 เมษายน 2026 เพราะหน้า Project Glasswing ของ Anthropic ระบุประกาศในวันดังกล่าว และบอกว่า Project Glasswing ขับเคลื่อนด้วย Claude Mythos Preview [12] ขณะที่หน้ารวม model system cards ของ Anthropic ระบุ Mythos Preview อยู่ในเดือน April 2026 [30]

แต่ถ้าหมายถึง เปิดให้ทุกคนใช้งานเหมือนโมเดล Claude ปกติ คำตอบคือยังไม่ใช่ Anthropic ระบุใน system card ว่าไม่ได้ปล่อย Claude Mythos Preview แบบ general availability [15]

Mythos Preview คืออะไร: โมเดลพรีวิวสำหรับความปลอดภัยซอฟต์แวร์สำคัญ

Project Glasswing ไม่ใช่หน้าเปิดตัวแชตบอตทั่วไป แต่เป็นโครงการด้านความปลอดภัยซอฟต์แวร์ Anthropic อธิบายว่าโครงการนี้มีเป้าหมายเพื่อปกป้องซอฟต์แวร์ที่สำคัญที่สุดของโลกในยุค AI และขับเคลื่อนด้วย Claude Mythos Preview ซึ่งบริษัทเรียกว่าเป็น “most capable model yet” ของตนในบริบทประกาศนั้น [12]

เหตุผลที่ Anthropic ไม่เปิด Mythos Preview ให้ผู้ใช้ทั่วไปเข้าถึงก็เกี่ยวข้องกับความสามารถด้านความปลอดภัยซอฟต์แวร์โดยตรง System card ระบุว่าความสามารถลักษณะนี้อาจใช้ได้ทั้งเพื่อค้นหาและแก้ช่องโหว่ในโค้ดซอฟต์แวร์ และในทางกลับกันก็อาจนำไปใช้เพื่อออกแบบวิธีโจมตีช่องโหว่ที่ซับซ้อนขึ้นได้ Anthropic จึงตัดสินใจไม่ปล่อย Mythos Preview แบบ general availability [15]

บล็อกของทีม red team จาก Anthropic ให้ภาพที่สอดคล้องกันว่า Mythos Preview ถูกเปิดให้กลุ่มจำกัดในช่วงแรกผ่าน Project Glasswing ได้แก่พันธมิตรในอุตสาหกรรมสำคัญและนักพัฒนาโอเพนซอร์สบางส่วน เพื่อให้ฝ่ายป้องกันเริ่มเสริมความปลอดภัยให้ระบบสำคัญก่อนที่โมเดลที่มีความสามารถใกล้เคียงกันจะถูกใช้งานอย่างแพร่หลายมากขึ้น [4]

คะแนนแรงแค่ไหน: benchmark ทางการสูงกว่า Claude Opus 4.6

ในข้อมูลเปรียบเทียบที่ Anthropic เผยแพร่บนหน้า Glasswing นั้น Claude Mythos Preview ทำคะแนนสูงกว่า Claude Opus 4.6 ใน benchmark ที่ระบุไว้ทุกชุด [16]

BenchmarkClaude Mythos PreviewClaude Opus 4.6
GPQA Diamond94.6%91.3%
Humanity’s Last Exam ไม่ใช้เครื่องมือ56.8%40.0%
Humanity’s Last Exam ใช้เครื่องมือ64.7%53.1%
BrowseComp86.9%83.7%
OSWorld-Verified79.6%72.7%

Anthropic ยังระบุด้วยว่าใน BrowseComp นอกจาก Mythos Preview จะได้คะแนนสูงกว่า Opus 4.6 แล้ว ยังใช้ token น้อยกว่า 4.9 เท่า [16]

ดังนั้น หากวัด “ความแรง” จากคะแนนทางการที่เปิดเผยในงานตอบคำถามยาก การใช้เครื่องมือ งานเบราว์ซข้อมูล และงานในสภาพแวดล้อมคอมพิวเตอร์ Mythos Preview ถือว่าอยู่ในระดับสูงมาก โดยเฉพาะเมื่อดูคู่กับบทบาทของมันใน Project Glasswing ซึ่งเน้นงานซอฟต์แวร์และความปลอดภัย [12][16]

แต่คะแนนสูงไม่ได้แปลว่าเหนือกว่าทุกสถานการณ์

ตัวเลขของ Mythos Preview น่าจับตา แต่ควรอ่านอย่างระมัดระวัง ไม่ควรสรุปแบบเหมารวมว่าโมเดลนี้จะดีกว่าในทุกงานจริงเสมอไป

เหตุผลแรกคือคะแนนเทียบโดยตรงที่อ้างได้ในที่นี้มาจากหน้าเผยแพร่ของ Anthropic เอง ไม่ใช่ผลทดสอบอิสระจากภายนอก [16] นั่นไม่ได้หมายความว่าคะแนนใช้ไม่ได้ แต่หมายความว่าควรมองเป็นข้อมูล benchmark ทางการจากผู้พัฒนา

เหตุผลที่สอง Anthropic เองก็ใส่ข้อสังเกตเกี่ยวกับ Humanity’s Last Exam ว่า Mythos ยังทำผลงานได้ดีแม้ในเงื่อนไข low-effort ซึ่งอาจบ่งชี้ถึงการจดจำข้อมูลบางส่วน [16] ดังนั้นคะแนน HLE ช่วยบอกความสามารถบนชุดทดสอบนั้นได้ แต่ไม่ควรถูกใช้เป็นหลักฐานเดี่ยวว่าโมเดลจะนำห่างในทุกโจทย์ที่ไม่เคยพบ

เหตุผลที่สาม เอกสารอัปเดตความเสี่ยงด้าน alignment ของ Mythos Preview แสดงว่าผลด้านความสามารถและความปลอดภัยไม่ได้เหนือกว่าแบบเส้นตรงในทุกมิติ เช่น ใน Minimal-LinuxBench ผลของ Mythos อยู่สูงกว่าหรือต่ำกว่า Claude Opus เล็กน้อยขึ้นอยู่กับการตั้งค่า และใน SHADE-Arena เงื่อนไข transcript ที่มี chain-of-thought ยาว อัตรา stealth success rate เพิ่มจากประมาณ 0% เป็นประมาณ 3.8% [13]

ข้อสรุปที่รัดกุมกว่าคือ Claude Mythos Preview ทำคะแนนนำ Claude Opus 4.6 ชัดเจนใน benchmark สำคัญที่ Anthropic เปิดเผย แต่ข้อมูลสาธารณะยังไม่พอจะยืนยันว่ามันจะเหนือกว่าในงานทั่วไป เช่น การเขียนภาษาไทย การสนทนาในชีวิตประจำวัน ความหน่วง ราคา ประสบการณ์ใช้งาน หรือทุกงานของผู้ใช้ทั่วไป [13][16]

ผู้ใช้ทั่วไปใช้ Claude Mythos Preview ได้ไหม

ยังไม่ควรมอง Mythos Preview เป็นโมเดล Claude สำหรับผู้ใช้ทั่วไป Anthropic ระบุใน system card ว่าไม่ได้ปล่อยแบบ general availability และให้เข้าถึงเฉพาะองค์กรพันธมิตรจำนวนหนึ่งที่ดูแลโครงสร้างพื้นฐานซอฟต์แวร์สำคัญ ภายใต้เงื่อนไขที่จำกัดการใช้ไว้ในงานไซเบอร์ซีเคียวริตี้ [15]

นั่นหมายความว่า หากคำถามของคุณคือใน Claude.ai จะมีปุ่มให้เลือก Mythos หรือไม่, API ปกติเรียกใช้ได้หรือยัง, ราคาเท่าไร, latency เป็นอย่างไร หรือ context window ใหญ่แค่ไหน ข้อมูลสาธารณะที่มีตอนนี้ยังไม่เพียงพอจะตอบแบบเป็นรายละเอียดผลิตภัณฑ์ได้ สิ่งที่ Anthropic เปิดเผยชัดที่สุดคือ Mythos Preview เป็นโมเดลแนวหน้าที่มีความอ่อนไหวสูงและถูกจำกัดไว้สำหรับงานป้องกันด้านความปลอดภัย ไม่ใช่ Claude รุ่นใหม่ที่ผู้ใช้ทั่วไปจะเปลี่ยนไปใช้ได้ทันที [12][15]

บทสรุป

Claude Mythos Preview ควรถูกเข้าใจว่าเป็น โมเดลพรีวิวแบบจำกัดการเข้าถึง ที่เปิดเผยต่อสาธารณะในเดือนเมษายน 2026 ผ่าน Project Glasswing และมุ่งเน้นความปลอดภัยของซอฟต์แวร์สำคัญ มากกว่าจะเป็น Claude รุ่นใหม่สำหรับทุกคน [12][15][30]

คะแนน benchmark ที่ Anthropic เผยแพร่ทำให้เห็นว่ามันแรงกว่า Claude Opus 4.6 ในหลายชุดทดสอบ แต่ Anthropic ก็ระบุชัดว่าไม่ได้เปิดใช้งานทั่วไป และจำกัดการเข้าถึงไว้กับพันธมิตรด้านไซเบอร์ซีเคียวริตี้บางกลุ่ม [15][16]

สำหรับผู้ใช้ทั่วไป ข้อสรุปที่สำคัญที่สุดจึงไม่ใช่ “ควรย้ายไปใช้ Mythos หรือยัง” แต่คือ ตอนนี้ Mythos Preview ยังไม่ใช่โมเดล Claude ปกติที่เลือกใช้งานได้โดยตรง

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

ค้นหาและตรวจสอบข้อเท็จจริงด้วย Studio Global AI

ประเด็นสำคัญ

  • Claude Mythos Preview ปรากฏต่อสาธารณะพร้อม Project Glasswing เมื่อ 7 เมษายน 2026 และอยู่ในหมวด April 2026 ของระบบการ์ดโมเดล Anthropic [12][30]
  • คะแนน benchmark ที่ Anthropic เปิดเผยสูงกว่า Claude Opus 4.6 ใน GPQA Diamond, Humanity’s Last Exam, BrowseComp และ OSWorld Verified [16]
  • โมเดลนี้ยังไม่ใช่รุ่นที่เปิดให้ใช้งานทั่วไป Anthropic ระบุว่าให้เข้าถึงเฉพาะองค์กรพันธมิตรบางรายที่ดูแลโครงสร้างพื้นฐานซอฟต์แวร์สำคัญ และจำกัดการใช้ในงานไซเบอร์ซีเคียวริตี้ [15]

คนยังถาม

คำตอบสั้น ๆ สำหรับ "Claude Mythos Preview: เปิดตัวเมษายน 2026 คะแนนแรงกว่า Opus 4.6 แต่ยังไม่เปิดให้ใช้ทั่วไป" คืออะไร

Claude Mythos Preview ปรากฏต่อสาธารณะพร้อม Project Glasswing เมื่อ 7 เมษายน 2026 และอยู่ในหมวด April 2026 ของระบบการ์ดโมเดล Anthropic [12][30]

ประเด็นสำคัญที่ต้องตรวจสอบก่อนคืออะไร?

Claude Mythos Preview ปรากฏต่อสาธารณะพร้อม Project Glasswing เมื่อ 7 เมษายน 2026 และอยู่ในหมวด April 2026 ของระบบการ์ดโมเดล Anthropic [12][30] คะแนน benchmark ที่ Anthropic เปิดเผยสูงกว่า Claude Opus 4.6 ใน GPQA Diamond, Humanity’s Last Exam, BrowseComp และ OSWorld Verified [16]

ฉันควรทำอย่างไรต่อไปในทางปฏิบัติ?

โมเดลนี้ยังไม่ใช่รุ่นที่เปิดให้ใช้งานทั่วไป Anthropic ระบุว่าให้เข้าถึงเฉพาะองค์กรพันธมิตรบางรายที่ดูแลโครงสร้างพื้นฐานซอฟต์แวร์สำคัญ และจำกัดการใช้ในงานไซเบอร์ซีเคียวริตี้ [15]

ฉันควรสำรวจหัวข้อที่เกี่ยวข้องใดต่อไป

ดำเนินการต่อด้วย "Claude Opus 4.7 เทียบ GPT-5.5, DeepSeek V4 และ Kimi K2.6: อ่านเบนช์มาร์กปี 2026 แบบไม่หลงตัวเลข" เพื่อดูอีกมุมหนึ่งและการอ้างอิงเพิ่มเติม

เปิดหน้าที่เกี่ยวข้อง

ฉันควรเปรียบเทียบสิ่งนี้กับอะไร?

ตรวจสอบคำตอบนี้กับ "DeepSeek V4: 1M context, MoE และเช็กลิสต์ย้าย API สำหรับนักพัฒนา"

เปิดหน้าที่เกี่ยวข้อง

ทำการวิจัยต่อ

การสนทนาการวิจัย

คุณ

คำถามวิจัย

克劳德·米索斯什么时候发布?实力如何?

Studio Global AI32 แหล่งที่มา

อ้างถึงคำตอบ

Bottom line

如果你说的是 Anthropic 的 Claude Mythos Preview,它的官方公开亮相时间是 2026 年 4 月 7 日,随 Project Glasswing 一起公布;Anthropic 的系统卡目录也把它标成 2026 年 4 月发布。[10][29]
就官方已公开的信息看,它非常强,尤其在高难推理、工具使用、浏览/电脑操作和安全相关软件任务上,公布分数整体高于 Claude Opus 4.6。[23][26]
但它不是面向所有用户的一般可用版,而是受限 preview,只开放给部分合作伙伴,并限制在网络安全场景使用。[23]

Key findings

  • Mythos Preview 是 Anthropic 在 2026 年 4 月公开的受限预览模型,不是大众开放产品。[10][23][29]
  • Anthropic 将它描述为其“most capable model yet”,并把它放在 Project Glasswing 这个“关键软件安全”项目中发布。[10]
  • 官方 benchmark 中,Mythos Preview 对 Opus 4.6 全面领先:GPQA Diamond 94.6% vs 91.3%,Humanity’s Last Exam 无工具 56.8% vs 40.0%,带工具 64.7% vs 53.1%,BrowseComp 86.9% vs 83.7%,OSWorld-Verified 79.6% vs 72.7%。[26]
  • Anthropic 也给了保留意见:Mythos 在 Humanity’s Last Exam 上“低 effort 仍表现很好”可能意味着存在一定记忆化因素,因此高分不应被简单等同于所有真实场景都同幅度领先。[26]

Confirmed facts

  • 官方公告显示,Project Glasswing 于 2026 年 4 月 7 日发布,并说明该项目由 Claude Mythos Preview 提供支持。[10]
  • Anthropic 的系统卡目录把 Mythos Preview 列为 “April 2026”。[29]
  • Anthropic 明确表示没有把 Mythos Preview 做一般公开发布,而是仅向部分维护重要软件基础设施的合作伙伴开放,并限制用途为网络安全。[23]
  • 按 Anthropic 公开分数,Mythos Preview 在多项关键 benchmark 上超过 Claude Opus 4.6。[26]

What remains inference

  • 如果你说的“实力”是日常聊天、写作、中文表现、稳定性、延迟和价格的综合体验,现有公开证据还不够完整;目前最强证据主要集中在高难推理、软件理解、工具调用和安全相关能力。
  • 从它的发布方式看,它更像“高能力但高风险、因此受限”的 frontier preview,而不是成熟的大众产品。

What the evidence suggests

  • 如果只看 Anthropic 官方口径,Mythos Preview 可以视为当时 Claude 体系里非常靠前、甚至最前沿的一档模型。[10][23][26]
  • 它的优势看起来尤其集中在需要深度推理、调用工具、浏览信息、操作计算机环境,以及理解和修改复杂软件的任务上。[23][26]
  • 对普通用户来说,当前更重要的结论不是“能不能用到最强 Claude”,而是“这个模型现在并不面向你直接开放”。[23]

Conflicting evidence or uncertainty

  • 目前直接证据几乎都来自 Anthropic 官方材料,所以“官方内部口径一致”这一点较强,但“外部独立复现已经充分验证”这一点还不够强。[10][23][26]
  • 官方风险更新摘要提到,在某些内部测试里,Mythos 的表现只是略高于或略低于 Claude Opus,取决于设置;这说明它并不是在所有子任务上都稳定大幅领先。[22]
  • 官方自己也承认,部分高分可能受记忆化影响。[26]

Open questions

  • Mythos Preview 何时会从受限 preview 变成一般可用产品,目前我没看到明确时间表。
  • 它的价格、API 可用性、延迟、上下文窗口等面向开发者的完整信息,公开证据还不充分。Insufficient evidence.

Sources worth trusting most

  • Project Glasswing 官方公告:确认首次公开时间和官方定位。[10]
  • Mythos Preview System Card:确认它不是一般公开版,而是受限开放。[23]
  • Glasswing benchmark 页面:看 Mythos 与 Opus 4.6 的直接分数对比和 caveat。[26]
  • Anthropic 系统卡目录:交叉确认发布时间属于 2026 年 4 月。[29]

Recommended next step

如果你愿意,我下一条可以直接帮你做一个“Claude Mythos Preview vs Claude Opus 4.7 vs GPT-5 vs Gemini 2.5 Pro”的简明对比,重点看:

  • 代码能力
  • 推理能力
  • Agent 能力
  • 普通用户是否能用
  • 性价比

Summary

简短说:Claude Mythos Preview 是 2026 年 4 月初公开的受限预览模型,官方公开亮相点是 4 月 7 日。[10][29]
按 Anthropic 公布的数据,它很强,而且在多项 benchmark 上超过了 Claude Opus 4.6。[26]
但它目前不是普通用户随便可用的常规 Claude,而是带使用限制的高能力预览版。[23]

แหล่งที่มา

  • [4] Claude Mythos Preview \ red.anthropic.comred.anthropic.com

    But the transitional period may be tumultuous regardless. By releasing this model initially to a limited group of critical industry partners and open source developers with Project Glasswing, we aim to enable defenders to begin securing the most important s...

  • [12] Project Glasswing - Anthropicanthropic.com

    Skip to footer Try Claude Claude Project Glasswing Claude Project Glasswing Claude Project Glasswing An initiative to secure the world’s most critical software with early access to frontier AI Read the announcement Announcements NEW Project Glasswing Apr 7,...

  • [13] [PDF] Alignment Risk Update: Claude Mythos Preview - Anthropicanthropic.com

    We have two “secret side task” evaluations that involve secret-keeping: SHADE-Arena, and Minimal-LinuxBench (the latter is non-public, but we believe it better represents our internal usage distribution). The most notable change in performance compared with...

  • [15] Claude Mythos Preview System Cardanthropic.com

    and fixing vulnerabilities in software code) and offensive purposes (designing sophisticated ways to exploit those vulnerabilities). It is largely due to these capabilities that we have made the decision not to release Claude Mythos Preview for general avai...

  • [16] Project Glasswing: Securing critical software for the AI era - Anthropicanthropic.com

    GPQA Diamond Mythos Preview 94.6% Opus 4.6 91.3% Humanity’s Last Exam Mythos Preview without tools 56.8% Opus 4.6 without tools 40.0% Mythos Preview with tools 64.7% Opus 4.6 with tools 53.1% Humanity’s Last Exam: We have found Mythos still performs well on...

  • [30] Model system cards - Anthropicanthropic.com

    Model Date System card --- Mythos Preview April 2026 Read system card Claude Sonnet 4.6 February 2026 Read system card Claude Opus 4.6 February 2026 Read system card Claude Opus 4.5 November 2025 Read system card Claude Haiku 4.5 October 2025 Read system ca...