การปรับปรุงหลายอย่างโดดเด่นเป็นพิเศษ ในด้านขีดความสามารถ Opus 4.8 ให้ผลลัพธ์ที่ดีขึ้นในการเขียนโค้ดแบบ Agentic งานความรู้หลากหลายสาขา และการใช้งานคอมพิวเตอร์แบบ Agentic ฟีเจอร์ใหม่ที่เรียกว่า Dynamic Workflows ใน Claude Code ช่วยให้โมเดลสามารถประสานงานกับ Sub-agent ย่อยนับร้อยแบบขนาน เพื่อทำงานโยกย้ายฐานโค้ดขนาดใหญ่ที่กินพื้นที่หลายแสนบรรทัด
ผู้ใช้ยังสามารถกำหนด ระดับความพยายาม (Effort Levels) ได้ ไม่ว่าจะเป็น
high, xhigh, และ max พร้อมด้วยโหมดเร็วที่ทำงานด้วยความเร็วสูงขึ้น 2.5 เท่า และถูกกว่าโหมดเร็วของรุ่นก่อนหน้าถึง 3 เท่า
ความน่าเชื่อถือได้รับการอัปเกรดครั้งใหญ่ Opus 4.8 ถูกฝึกให้ระบุความไม่แน่นอนในงานของตัวเองได้อย่างมีประสิทธิภาพมากขึ้น มันมีแนวโน้มที่จะปล่อยให้ข้อผิดพลาดในโค้ดของตัวเองหลุดรอดไปโดยไม่แจ้งเตือน น้อยกว่ารุ่นก่อนหน้าถึงประมาณ 4 เท่า ซึ่งช่วยแก้ปัญหาความน่าหงุดหงิดที่ผู้ใช้มักเจอเมื่อโมเดลขั้นสูงส่งงานที่มีข้อผิดพลาดออกมาอย่างมั่นอกมั่นใจ Anthropic เรียกสิ่งนี้ว่าเป็นความก้าวหน้าครั้งสำคัญในด้านความซื่อสัตย์ของโมเดลสำหรับงานวิศวกรรมซอฟต์แวร์
ประเด็นสำคัญคือ แม้ Opus 4.8 จะเป็น Agent อัตโนมัติที่แข็งแกร่งขึ้น แต่มันก็ถูกสร้างขึ้นบนมาตรฐานการปรับใช้และความปลอดภัยระดับ ASL-3 (AI Safety Level 3) เช่นเดียวกับโมเดลอื่นๆ ในตระกูล Claude Opus 4 มาตรการเหล่านี้รวมถึงระบบป้องกันที่เข้มงวดซึ่งจะบล็อกคำขอที่บ่งชี้ถึงการใช้เพื่อความปลอดภัยทางไซเบอร์ที่มีความเสี่ยงสูงหรือถูกห้ามโดยอัตโนมัติ รวมถึงการควบคุมความปลอดภัยที่แข็งแกร่งเพื่อปกป้องค่าน้ำหนักของโมเดล (Model Weights) จากการถูกขโมยโดยกลุ่มบุคคลที่มีความซับซ้อนที่ไม่ใช่รัฐ
เรื่องราวของ Claude Mythos Preview คือสิ่งที่ทำให้การเปิดตัวครั้งนี้แตกต่างจากการอัปเดตโมเดลตามปกติทั่วไป ในเดือนเมษายน 2026 Anthropic ได้เปิดเผยการมีอยู่ของโมเดลนี้ แต่ปฏิเสธที่จะปล่อยออกสู่สาธารณะอย่างชัดเจน เหตุผลหลักก็คือ Mythos Preview ได้แสดงให้เห็นถึงความสามารถในการค้นหาและใช้ประโยชน์จากช่องโหว่ Zero-day ในระบบปฏิบัติการหลักและเว็บเบราว์เซอร์ทุกตัวได้ด้วยตัวเอง สถาบันความปลอดภัย AI แห่งสหราชอาณาจักร (UK AISI) ยืนยันว่า Mythos Preview สามารถแก้ปัญหาความท้าทายด้านความปลอดภัยทางไซเบอร์ระดับผู้เชี่ยวชาญ (CTF) ได้ถึง 73% ซึ่งเป็นผลลัพธ์ที่น่าตกตะลึงและทิ้งห่างโมเดลรุ่นก่อนๆ อย่างไม่เห็นฝุ่น
เพื่อบรรเทาความเสี่ยงที่เห็นได้ชัดนี้ Anthropic จึงสร้าง Project Glasswing ขึ้นมา ซึ่งเป็นโครงการที่ถูกควบคุมอย่างเข้มงวด โดยเปิดให้องค์กรพันธมิตรประมาณ 50 แห่ง เช่น AWS, Apple, Google, Microsoft, CrowdStrike และ JPMorgan Chase เข้าถึง Mythos Preview เพื่อใช้ในการค้นหาช่องโหว่เชิงรับเท่านั้น ผลลัพธ์ที่ได้นั้นยิ่งใหญ่เป็นประวัติการณ์ บรรดาพันธมิตรค้นพบ ช่องโหว่ระดับความรุนแรงสูงหรือวิกฤตมากกว่า 10,000 รายการ ทั่วทั้งซอฟต์แวร์ที่มีความสำคัญเชิงระบบมากที่สุดในโลก โดยองค์กรส่วนใหญ่ค้นพบช่องโหว่ลักษณะนี้หลายร้อยรายการภายในเดือนแรกที่เข้าถึง
ในจำนวนนั้น 6,202 รายการถูกจัดว่าเป็นช่องโหว่ Zero-day ใหม่ที่ไม่เคยมีใครรู้จักมาก่อน
การค้นพบครอบคลุมถึงโครงสร้างพื้นฐานที่สำคัญและรวมไปถึงข้อบกพร่องที่ฝังลึกอยู่ในระบบ เช่น ช่องโหว่อายุ 27 ปีใน OpenBSD ซึ่งเป็นหนึ่งในระบบปฏิบัติการที่ได้รับการเสริมความปลอดภัยเข้มงวดที่สุดในโลก
ในวันที่ 28 พฤษภาคม Anthropic ประกาศว่าการทดลองนี้ประสบความสำเร็จ และเปิดเผยว่ากำลังเตรียมที่จะปล่อยโมเดลระดับ Mythos ในฐานะ "โมเดลระดับใหม่" ให้กับลูกค้าทุกคนภายในไม่กี่สัปดาห์ข้างหน้า ผลลัพธ์จาก Glasswing เป็นหลักฐานที่แสดงให้เห็นว่าภายใต้มาตรการป้องกันที่เหมาะสม โมเดลเหล่านี้สามารถถูกใช้งานเพื่อความปลอดภัยทางไซเบอร์เชิงรับได้อย่างปลอดภัย นักวิเคราะห์อุตสาหกรรมรายงานว่า Claude Mythos 1 คาดว่าจะเปิดตัวในเดือนมิถุนายน 2026 พร้อมๆ กับโมเดลหลักตัวอื่นๆ อย่าง Gemini 3.5 Pro และ Grok 5
การเปิดตัวผลิตภัณฑ์ครั้งนี้มาพร้อมกับแรงสั่นสะเทือนทางการเงิน ในวันเดียวกันนั้น Anthropic ประกาศว่าบริษัทปิดการระดมทุนรอบ Series H ได้สำเร็จด้วยมูลค่า 65,000 ล้านดอลลาร์ ณ มูลค่ากิจการหลังระดมทุนที่ 965,000 ล้านดอลลาร์ ซึ่งมากกว่าสองเท่าของมูลค่าก่อนหน้านี้ที่ 380,000 ล้านดอลลาร์จากเดือนกุมภาพันธ์ การระดมทุนรอบนี้นำโดย Altimeter Capital, Dragoneer, Greenoaks และ Sequoia Capital โดยมีผู้ลงทุนรายใหญ่อย่าง Blackstone, D.E. Shaw, DST Global และ Fidelity ร่วมลงทุนด้วย
เม็ดเงินจำนวนนี้ทำให้ Anthropic กลายเป็นสตาร์ทอัปด้าน AI ที่มีมูลค่าสูงที่สุดในโลกอย่างเป็นทางการ แซงหน้ามูลค่าที่ได้รับการยืนยันล่าสุดของ OpenAI ที่ 852,000 ล้านดอลลาร์ Anthropic ระบุว่าเงินทุนจะถูกใช้เพื่อขยายขีดความสามารถทางการประมวลผลเพื่อรองรับความต้องการที่เพิ่มขึ้นจากองค์กรสำหรับ Claude และเพื่อขยายผลิตภัณฑ์ไปทั่วโลก
การตัดสินใจผลักดัน Mythos ออกสู่ตลาดในวงกว้างนั้นไม่ได้ปราศจากเสียงคัดค้าน หัวใจของข้อถกเถียงคือปัญหา "การใช้ประโยชน์สองด้าน (Dual-use)": พลังในการหาเหตุผลเดียวกันกับที่ทำให้ Mythos นั้นยอดเยี่ยมในการหาช่องโหว่เพื่อปิดช่องโหว่ ก็ยังทำให้มันเป็นเครื่องมือในการโจมตีขั้นสูงสุดเช่นกัน นักวิเคราะห์เตือนว่าการเข้าถึงในวงกว้างอาจทำให้ผู้ไม่หวังดีมีเครื่องมือที่สามารถเชื่อมโยงช่องโหว่หลายจุดเพื่อเลี่ยงผ่านระบบ Sandbox ของระบบปฏิบัติการ และระบบป้องกันของเบราว์เซอร์ได้เองโดยอัตโนมัติ
รูปแบบการทำงานของ Bug Bounty และ Ethical Hacking แบบดั้งเดิมกำลังเผชิญกับคำถามถึงการดำรงอยู่ หากโมเดลเพียงตัวเดียวสามารถค้นพบช่องโหว่ Zero-day ได้หลายพันรายการด้วยตัวเอง บทบาทของนักวิจัยความปลอดภัยที่เป็นมนุษย์จะเปลี่ยนจากการค้นหามาเป็นการคัดกรองและควบคุมแทน กลยุทธ์การควบคุมของ Anthropic ที่ใช้ Project Glasswing เพื่อกรองการเข้าถึงให้กับองค์กรที่ผ่านการตรวจสอบแล้ว 50 แห่ง ได้รับทั้งคำชื่นชมและคำวิจารณ์ ผู้สนับสนุนแย้งว่ามันป้องกันการรั่วไหลที่อาจเป็นหายนะ ในขณะที่พิสูจน์คุณค่าในการป้องกันของโมเดล ในขณะที่นักวิจารณ์แย้งว่าการเก็บเครื่องมือเช่นนี้ไว้ไม่ให้ชุมชนความปลอดภัยในวงกว้างเข้าถึง จะทำให้กระบวนการแก้ไขช่องโหว่ทั่วโลกช้าลง
การประกาศในวันที่ 28 พฤษภาคมนี้ ถือเป็นจุดสิ้นสุดของการทดลอง และเป็นจุดเริ่มต้นของช่วงเวลาใหม่ Anthropic กำลังเดิมพันว่าผลประโยชน์เชิงป้องกันของโมเดลระดับ Mythos ที่ถูกปล่อยออกไปในวงกว้างนั้นมีมากกว่าความเสี่ยงในการถูกใช้เป็นเครื่องมือโจมตี ซึ่งเป็นการเดิมพันที่จะถูกทดสอบทันทีที่มันถูกปล่อยออกไป
Comments
0 comments