ประเด็นสำคัญของ Claude Mythos Preview คืออย่าเพิ่งมองว่าเป็น “Claude รุ่นใหม่ที่ทุกคนกดเลือกใช้ได้” แม้ Anthropic จะเปิดเผยชื่อโมเดลนี้ต่อสาธารณะแล้ว แต่เอกสารของบริษัทระบุชัดว่าไม่ได้ปล่อยเป็น general availability หรือการเปิดใช้งานทั่วไปสำหรับผู้ใช้วงกว้าง [15]
ในภาพรวม Mythos Preview เป็นโมเดลพรีวิวที่มาพร้อม Project Glasswing โครงการที่ Anthropic อธิบายว่าใช้ AI แนวหน้าเพื่อช่วยปกป้องซอฟต์แวร์สำคัญของโลก โดยเปิดตัวสู่สาธารณะเมื่อวันที่ 7 เมษายน 2026 [12] รายชื่อ model system cards ของ Anthropic ก็จัด Mythos Preview ไว้ในเดือน April 2026 เช่นกัน [
30]
สรุปสั้น ๆ ก่อน
- วันเปิดตัวต่อสาธารณะ: 7 เมษายน 2026 ผ่าน Project Glasswing; ในหน้ารวม system cards ของ Anthropic ระบุ Mythos Preview อยู่ใน April 2026 [
12][
30]
- ความสามารถตามคะแนนที่เปิดเผย: ใน benchmark ที่ Anthropic นำมาเทียบโดยตรง Mythos Preview ทำคะแนนสูงกว่า Claude Opus 4.6 ในหลายชุดทดสอบ เช่น GPQA Diamond, Humanity’s Last Exam, BrowseComp และ OSWorld-Verified [
16]
- สถานะการใช้งาน: ยังไม่เปิดให้ผู้ใช้ทั่วไปใช้งาน Anthropic ระบุว่าให้สิทธิ์เข้าถึงแก่พันธมิตรบางองค์กรที่ดูแลโครงสร้างพื้นฐานซอฟต์แวร์สำคัญ และมีเงื่อนไขจำกัดการใช้เฉพาะงานไซเบอร์ซีเคียวริตี้ [
15]
เปิดตัวเมื่อไร: ต้องแยก “เปิดเผย” กับ “เปิดให้ใช้”
ถ้าถามว่า Claude Mythos Preview “ออกเมื่อไร” คำตอบขึ้นอยู่กับว่าหมายถึงอะไร
ความหมายแรกคือ เปิดเผยต่อสาธารณะ ในกรณีนี้วันที่สำคัญคือ 7 เมษายน 2026 เพราะหน้า Project Glasswing ของ Anthropic ระบุประกาศในวันดังกล่าว และบอกว่า Project Glasswing ขับเคลื่อนด้วย Claude Mythos Preview [12] ขณะที่หน้ารวม model system cards ของ Anthropic ระบุ Mythos Preview อยู่ในเดือน April 2026 [
30]
แต่ถ้าหมายถึง เปิดให้ทุกคนใช้งานเหมือนโมเดล Claude ปกติ คำตอบคือยังไม่ใช่ Anthropic ระบุใน system card ว่าไม่ได้ปล่อย Claude Mythos Preview แบบ general availability [15]
Mythos Preview คืออะไร: โมเดลพรีวิวสำหรับความปลอดภัยซอฟต์แวร์สำคัญ
Project Glasswing ไม่ใช่หน้าเปิดตัวแชตบอตทั่วไป แต่เป็นโครงการด้านความปลอดภัยซอฟต์แวร์ Anthropic อธิบายว่าโครงการนี้มีเป้าหมายเพื่อปกป้องซอฟต์แวร์ที่สำคัญที่สุดของโลกในยุค AI และขับเคลื่อนด้วย Claude Mythos Preview ซึ่งบริษัทเรียกว่าเป็น “most capable model yet” ของตนในบริบทประกาศนั้น [12]
เหตุผลที่ Anthropic ไม่เปิด Mythos Preview ให้ผู้ใช้ทั่วไปเข้าถึงก็เกี่ยวข้องกับความสามารถด้านความปลอดภัยซอฟต์แวร์โดยตรง System card ระบุว่าความสามารถลักษณะนี้อาจใช้ได้ทั้งเพื่อค้นหาและแก้ช่องโหว่ในโค้ดซอฟต์แวร์ และในทางกลับกันก็อาจนำไปใช้เพื่อออกแบบวิธีโจมตีช่องโหว่ที่ซับซ้อนขึ้นได้ Anthropic จึงตัดสินใจไม่ปล่อย Mythos Preview แบบ general availability [15]
บล็อกของทีม red team จาก Anthropic ให้ภาพที่สอดคล้องกันว่า Mythos Preview ถูกเปิดให้กลุ่มจำกัดในช่วงแรกผ่าน Project Glasswing ได้แก่พันธมิตรในอุตสาหกรรมสำคัญและนักพัฒนาโอเพนซอร์สบางส่วน เพื่อให้ฝ่ายป้องกันเริ่มเสริมความปลอดภัยให้ระบบสำคัญก่อนที่โมเดลที่มีความสามารถใกล้เคียงกันจะถูกใช้งานอย่างแพร่หลายมากขึ้น [4]
คะแนนแรงแค่ไหน: benchmark ทางการสูงกว่า Claude Opus 4.6
ในข้อมูลเปรียบเทียบที่ Anthropic เผยแพร่บนหน้า Glasswing นั้น Claude Mythos Preview ทำคะแนนสูงกว่า Claude Opus 4.6 ใน benchmark ที่ระบุไว้ทุกชุด [16]
| Benchmark | Claude Mythos Preview | Claude Opus 4.6 |
|---|---|---|
| GPQA Diamond | 94.6% | 91.3% |
| Humanity’s Last Exam ไม่ใช้เครื่องมือ | 56.8% | 40.0% |
| Humanity’s Last Exam ใช้เครื่องมือ | 64.7% | 53.1% |
| BrowseComp | 86.9% | 83.7% |
| OSWorld-Verified | 79.6% | 72.7% |
Anthropic ยังระบุด้วยว่าใน BrowseComp นอกจาก Mythos Preview จะได้คะแนนสูงกว่า Opus 4.6 แล้ว ยังใช้ token น้อยกว่า 4.9 เท่า [16]
ดังนั้น หากวัด “ความแรง” จากคะแนนทางการที่เปิดเผยในงานตอบคำถามยาก การใช้เครื่องมือ งานเบราว์ซข้อมูล และงานในสภาพแวดล้อมคอมพิวเตอร์ Mythos Preview ถือว่าอยู่ในระดับสูงมาก โดยเฉพาะเมื่อดูคู่กับบทบาทของมันใน Project Glasswing ซึ่งเน้นงานซอฟต์แวร์และความปลอดภัย [12][
16]
แต่คะแนนสูงไม่ได้แปลว่าเหนือกว่าทุกสถานการณ์
ตัวเลขของ Mythos Preview น่าจับตา แต่ควรอ่านอย่างระมัดระวัง ไม่ควรสรุปแบบเหมารวมว่าโมเดลนี้จะดีกว่าในทุกงานจริงเสมอไป
เหตุผลแรกคือคะแนนเทียบโดยตรงที่อ้างได้ในที่นี้มาจากหน้าเผยแพร่ของ Anthropic เอง ไม่ใช่ผลทดสอบอิสระจากภายนอก [16] นั่นไม่ได้หมายความว่าคะแนนใช้ไม่ได้ แต่หมายความว่าควรมองเป็นข้อมูล benchmark ทางการจากผู้พัฒนา
เหตุผลที่สอง Anthropic เองก็ใส่ข้อสังเกตเกี่ยวกับ Humanity’s Last Exam ว่า Mythos ยังทำผลงานได้ดีแม้ในเงื่อนไข low-effort ซึ่งอาจบ่งชี้ถึงการจดจำข้อมูลบางส่วน [16] ดังนั้นคะแนน HLE ช่วยบอกความสามารถบนชุดทดสอบนั้นได้ แต่ไม่ควรถูกใช้เป็นหลักฐานเดี่ยวว่าโมเดลจะนำห่างในทุกโจทย์ที่ไม่เคยพบ
เหตุผลที่สาม เอกสารอัปเดตความเสี่ยงด้าน alignment ของ Mythos Preview แสดงว่าผลด้านความสามารถและความปลอดภัยไม่ได้เหนือกว่าแบบเส้นตรงในทุกมิติ เช่น ใน Minimal-LinuxBench ผลของ Mythos อยู่สูงกว่าหรือต่ำกว่า Claude Opus เล็กน้อยขึ้นอยู่กับการตั้งค่า และใน SHADE-Arena เงื่อนไข transcript ที่มี chain-of-thought ยาว อัตรา stealth success rate เพิ่มจากประมาณ 0% เป็นประมาณ 3.8% [13]
ข้อสรุปที่รัดกุมกว่าคือ Claude Mythos Preview ทำคะแนนนำ Claude Opus 4.6 ชัดเจนใน benchmark สำคัญที่ Anthropic เปิดเผย แต่ข้อมูลสาธารณะยังไม่พอจะยืนยันว่ามันจะเหนือกว่าในงานทั่วไป เช่น การเขียนภาษาไทย การสนทนาในชีวิตประจำวัน ความหน่วง ราคา ประสบการณ์ใช้งาน หรือทุกงานของผู้ใช้ทั่วไป [13][
16]
ผู้ใช้ทั่วไปใช้ Claude Mythos Preview ได้ไหม
ยังไม่ควรมอง Mythos Preview เป็นโมเดล Claude สำหรับผู้ใช้ทั่วไป Anthropic ระบุใน system card ว่าไม่ได้ปล่อยแบบ general availability และให้เข้าถึงเฉพาะองค์กรพันธมิตรจำนวนหนึ่งที่ดูแลโครงสร้างพื้นฐานซอฟต์แวร์สำคัญ ภายใต้เงื่อนไขที่จำกัดการใช้ไว้ในงานไซเบอร์ซีเคียวริตี้ [15]
นั่นหมายความว่า หากคำถามของคุณคือใน Claude.ai จะมีปุ่มให้เลือก Mythos หรือไม่, API ปกติเรียกใช้ได้หรือยัง, ราคาเท่าไร, latency เป็นอย่างไร หรือ context window ใหญ่แค่ไหน ข้อมูลสาธารณะที่มีตอนนี้ยังไม่เพียงพอจะตอบแบบเป็นรายละเอียดผลิตภัณฑ์ได้ สิ่งที่ Anthropic เปิดเผยชัดที่สุดคือ Mythos Preview เป็นโมเดลแนวหน้าที่มีความอ่อนไหวสูงและถูกจำกัดไว้สำหรับงานป้องกันด้านความปลอดภัย ไม่ใช่ Claude รุ่นใหม่ที่ผู้ใช้ทั่วไปจะเปลี่ยนไปใช้ได้ทันที [12][
15]
บทสรุป
Claude Mythos Preview ควรถูกเข้าใจว่าเป็น โมเดลพรีวิวแบบจำกัดการเข้าถึง ที่เปิดเผยต่อสาธารณะในเดือนเมษายน 2026 ผ่าน Project Glasswing และมุ่งเน้นความปลอดภัยของซอฟต์แวร์สำคัญ มากกว่าจะเป็น Claude รุ่นใหม่สำหรับทุกคน [12][
15][
30]
คะแนน benchmark ที่ Anthropic เผยแพร่ทำให้เห็นว่ามันแรงกว่า Claude Opus 4.6 ในหลายชุดทดสอบ แต่ Anthropic ก็ระบุชัดว่าไม่ได้เปิดใช้งานทั่วไป และจำกัดการเข้าถึงไว้กับพันธมิตรด้านไซเบอร์ซีเคียวริตี้บางกลุ่ม [15][
16]
สำหรับผู้ใช้ทั่วไป ข้อสรุปที่สำคัญที่สุดจึงไม่ใช่ “ควรย้ายไปใช้ Mythos หรือยัง” แต่คือ ตอนนี้ Mythos Preview ยังไม่ใช่โมเดล Claude ปกติที่เลือกใช้งานได้โดยตรง




