การคาดการณ์ของชุมชนระบุช่วงเวลาการเปิดตัวที่เป็นไปได้ระหว่างวันที่ 15 มิถุนายน ถึง 5 กรกฎาคม 2026 แต่เส้นเวลาดังกล่าวเป็นเพียงการคาดการณ์ล้วนๆ จากการพบเห็นในบันทึก และไม่มีหลักฐานอย่างเป็นทางการรองรับ ยังไม่มีข้อมูลที่แน่ชัดเกี่ยวกับราคา ประสิทธิภาพของโทเคน หรือความสามารถแบบหลายรูปแบบที่ได้รับการยืนยันสำหรับ GPT‑5.6 เชิงสมมติฐานนี้ การคาดการณ์ถึงความคุ้มค่าที่ดีขึ้นและการสร้างข้อความพร้อมรูปภาพนั้นเป็นการอนุมานจากแนวโน้มของโมเดลตระกูล 5.x ไม่ใช่สเป็คที่ถูกบันทึกไว้เป็นเอกสาร
บรรทัดสุดท้าย: GPT‑5.6 เป็นข่าวรั่วที่น่าเชื่อถือ ไม่ใช่ผลิตภัณฑ์ อุตสาหกรรมกำลังจับตาดูพฤติกรรมของระบบเบื้องหลัง แต่ยังไม่มีการประกาศวันเปิดตัวหรือสเป็คทางเทคนิคใดๆ จาก OpenAI
คำว่า "เกณฑ์มาตรฐาน Mythos" ปรากฏในหลายบริบทที่แตกต่างกัน ซึ่งอาจก่อให้เกิดความสับสนได้:
การรั่วไหลของโมเดล Claude Mythos ของ Anthropic (26 มีนาคม 2026): เหตุการณ์การตั้งค่าระบบจัดการเนื้อหาผิดพลาดของ Anthropic ทำให้เอกสารภายในประมาณ 3,000 ชิ้นหลุดออกมาโดยไม่ได้ตั้งใจ ซึ่งรวมถึงร่างโพสต์เกี่ยวกับโมเดลรุ่นต่อไปที่ใช้โค้ดเนมว่า “Capybara” และมีชื่ออย่างเป็นทางการว่า Claude Mythos มาตรฐานภายในที่รั่วไหลออกมาแสดงให้เห็นว่า Mythos ทำคะแนนได้ 93.9% บน SWE‑bench Verified และ 77.8% บน SWE‑bench Pro ซึ่งเป็นผู้นำเหนือทุกมาตรฐานหลักด้านการเขียนโค้ดในขณะนั้น
ในวันที่ 7 เมษายน 2026 Anthropic ได้ประกาศเปิดตัว Claude Mythos Preview อย่างเป็นทางการ—แต่ในขณะเดียวกันก็ประกาศว่าสาธารณชนไม่สามารถใช้งานมันได้
ตัวโมเดลยังถูกตั้งข้อสังเกตว่ามีความสามารถด้านความปลอดภัยทางไซเบอร์ที่โดดเด่น รวมถึงการพบช่องโหว่อายุ 27 ปีในระบบ OpenBSD
เกณฑ์มาตรฐานด้านความปลอดภัยจาก Carnegie Mellon University (พฤษภาคม 2026): นักวิจัยจาก CMU ได้สร้างแบบประเมินแยกต่างหากเพื่อทดสอบว่าโมเดล AI สามารถพัฒนาโค้ดเจาะช่องโหว่ของเบราว์เซอร์จริงที่พุ่งเป้าไปที่ Google V8 engine ได้ด้วยตัวเองหรือไม่ ทั้ง Claude Mythos และ GPT‑5.5 ต่างพิสูจน์ให้เห็นว่าสามารถค้นหาและใช้ประโยชน์จากช่องโหว่ด้านความปลอดภัยจริงได้โดยปราศจากการแทรกแซงจากมนุษย์ โดย Mythos มีประสิทธิภาพเหนือกว่า GPT‑5.5 อย่างมีนัยสำคัญ ในขณะที่มีค่าใช้จ่ายในการรันที่สูงกว่าประมาณสิบสองเท่า
เกณฑ์มาตรฐานช่องโหว่ Mythos ของ SecureAI (มกราคม 2026): ชุดเกณฑ์มาตรฐานที่เน้นด้านความปลอดภัยทางไซเบอร์ ซึ่งครอบคลุม CVE ตั้งแต่ปี 2023–2026 ออกแบบมาเพื่อประเมินเครื่องมือตรวจจับช่องโหว่ของ AI โดยใช้โมเดลขนาดใหญ่อย่าง Llama‑3.1‑405B เป็นพื้นฐาน
เวลาที่มีคนพูดถึง "การรั่วไหลของเกณฑ์มาตรฐาน Mythos" พวกเขามักจะหมายถึงการรั่วไหลของโมเดลของ Anthropic ส่วนเกณฑ์มาตรฐานของ CMU และ SecureAI นั้นเป็นความพยายามที่แยกออกไปและใช้ชื่อ “Mythos” ร่วมกันโดยบังเอิญเท่านั้น
ในงาน "Intelligence at Work" เมื่อวันที่ 2 มิถุนายน 2026 OpenAI ได้ประกาศการขยายโครงสร้างของ Codex จากเครื่องมือช่วยเขียนโค้ดสำหรับนักพัฒนา ไปสู่แพลตฟอร์มการทำงานที่กว้างขึ้นสำหรับองค์กร เสาหลักสามประการของประกาศที่ได้รับการยืนยันคือ:
OpenAI ยังยืนยันด้วยว่า Codex มีผู้ใช้งานรายสัปดาห์เกิน 5 ล้านคนแล้ว การขยายตัวครั้งนี้แสดงให้เห็นถึงการเคลื่อนไหวเชิงกลยุทธ์ที่ชัดเจนเพื่อดึงดูดกลุ่มผู้ปฏิบัติงานที่ไม่ได้เป็นนักพัฒนาในองค์กร ซึ่งเป็นทิศทางที่บทวิเคราะห์อิสระหลายแห่งระบุว่าเป็นแกนการแข่งขันโดยตรงกับเครื่องมือที่ก่อนหน้านี้มุ่งเน้นไปที่ทีมวิศวกรรมแทบทั้งหมด
ในงานประชุมนักพัฒนา Build ประจำปี 2026 ณ ซานฟรานซิสโก เมื่อวันที่ 2 มิถุนายน Microsoft ได้เปิดตัวตระกูลโมเดล AI ที่พัฒนาขึ้นภายในองค์กรจำนวนเจ็ดตัว ภายใต้แบรนด์ MAI (Microsoft AI) ที่เป็นหนึ่งเดียว พร้อมด้วยฮาร์ดแวร์ใหม่
จุดศูนย์กลางอยู่ที่ MAI‑Thinking‑1 โมเดลด้านการให้เหตุผลตัวแรกของบริษัท:
โมเดลอีกหกตัวที่เหลือช่วยเติมเต็มระบบนิเวศแบบหลายรูปแบบให้สมบูรณ์:
การประกาศด้านฮาร์ดแวร์รวมถึง Surface RTX Spark Dev Box ซึ่งเป็นเครื่องพัฒนาปัญญาประดิษฐ์ขนาดกะทัดรัดที่สามารถประมวลผล AI ได้สูงสุดหนึ่งเพตาฟลอปส์ พร้อมด้วยหน่วยความจำรวม 128 GB และถูกออกแบบมาให้สามารถรันโมเดลที่มีจำนวนพารามิเตอร์สูงถึง 1.2 แสนล้านพารามิเตอร์ได้ในเครื่อง Microsoft ยังได้เปิดตัวชิปควอนตัม Majorana 2 ซึ่งเป็นการส่งสัญญาณถึงการเร่งความทะเยอทะยานด้านฮาร์ดแวร์ที่นอกเหนือไปจากการประมวลผล AI แบบดั้งเดิม
ตระกูลโมเดล MAI ทั้งเจ็ดถูกตีความอย่างกว้างขวางว่าเป็นการเคลื่อนไหวเพื่อลดการพึ่งพาโมเดลของ OpenAI ในขณะที่มอบทางเลือกที่ถูกพัฒนาขึ้นภายในองค์กรพร้อมใบอนุญาตเชิงพาณิชย์ที่สะอาดให้แก่ลูกค้า
"Vibe Coding"—แนวปฏิบัติในการสร้างแอปพลิเคชันทั้งหมดผ่านคำสั่งแบบการสนทนาแทนที่จะเขียนไวยากรณ์โค้ด—ได้ก่อให้เกิดมาตรวัดรุ่นใหม่ที่พยายามวัดความสามารถแบบ Full‑stack มากกว่าการทำงานด้านโค้ดแบบแยกส่วน:
สามแพลตฟอร์มนี้มีเป้าหมายร่วมกันในการขับเคลื่อนการประเมินผลการเขียนโค้ดของ AI ให้ก้าวข้ามมาตรวัดอัตราการผ่าน (pass‑rate) อย่าง SWE‑bench ไปสู่การวัดแบบองค์รวมในด้านการใช้งาน, ความเร็ว, ต้นทุน และความปลอดภัย
ในวันที่ 2 มิถุนายน 2026 Nous Research ได้ปล่อย Hermes Desktop ในรูปแบบตัวอย่างสาธารณะ มาพร้อมกับ Hermes Agent v0.15.2 และเผยแพร่ภายใต้ใบอนุญาต MIT สำหรับ macOS 12+, Windows 10/11 และ Linux
ก่อนหน้านี้ Hermes สามารถเข้าถึงได้ผ่านทาง command‑line interface หรือเกตเวย์ส่งข้อความเท่านั้น แอปพลิเคชันเดสก์ท็อปนี้คือส่วนติดต่อผู้ใช้แบบกราฟิกที่ใช้โค้ดหลักของเอเจนต์, กุญแจ API, เซสชัน, ทักษะ และหน่วยความจำร่วมกับ CLI ทำให้มันเป็นอีกหนึ่งช่องทางในการใช้งานแทนที่จะเป็นแยกสายการพัฒนา
Nous Research อธิบาย Hermes ว่าเป็น “เอเจนต์ที่พัฒนาตนเองได้ ไม่ใช่ผู้ช่วยเขียนโค้ด” เอเจนต์ตัวนี้เติบโตจากการเปิดตัวสู่ยอดดาวประมาณ 180,000 ดาวบน GitHub ในเวลาราวสามเดือน ทำให้มันเป็นหนึ่งในโปรเจกต์เอเจนต์โอเพนซอร์สที่เติบโตเร็วที่สุดในระบบนิเวศ
Alibaba เปิดตัว Qwen 3.7 Plus ในประมาณวันที่ 1–2 มิถุนายน 2026 มันคือโมเดลเอเจนต์แบบหลายรูปแบบที่ประมวลผลข้อความ รูปภาพ และวิดีโอผ่านการฝึกฝนแบบ early‑fusion ด้วยหน้าต่างข้อความขนาด 1 ล้านโทเคน
ราคาถูกตั้งไว้ที่ประมาณหนึ่งในหกของต้นทุนต่อโทเคนของ Qwen 3.7 Max ซึ่งเป็นโมเดลข้อความล้วนของ Alibaba ทำให้มันเป็นหนึ่งในเอเจนต์หลายรูปแบบที่มีราคาดุเดือดที่สุดในตลาด ในมาตรวัดประสิทธิภาพของเอเจนต์ Qwen 3.7 Plus เอาชนะ Claude Opus 4.6 บน Terminal‑Bench 2.0 และมีความสามารถในการจดจำ/ทำให้ UI ทำงานอัตโนมัติ, การสร้างโค้ดจากภาพ และการตอบคำถามด้วยภาพ
Claude Code คือเครื่องมือเขียนโค้ดแบบเอเจนต์ของ Anthropic ที่ทำงานโดยตรงในเทอร์มินัล รันคำสั่ง shell และแก้ไขไฟล์บนเครื่องของนักพัฒนา คำสั่ง /fork จะสร้างเซสชันใหม่ที่แตกแขนงออกมาจากเซสชันเดิม โดยเก็บไว้ภายใต้ commands/branch/ ซึ่งเปิดใช้ขั้นตอนการทำงานที่นักพัฒนาสามารถสำรวจทิศทางที่แตกต่างไปได้โดยไม่สูญเสียบริบทจากเซสชันดั้งเดิม
Claude Code ได้กลายเป็นหนึ่งในเครื่องมือพัฒนา AI ที่ถูกนำไปใช้อย่างแพร่หลายที่สุด โดยการกล่าวถึงแพ็กเกจ npm หนึ่งครั้งมียอดดาวสะสมมากกว่า 1,100 ดาวและถูก fork ไปมากกว่า 1,900 ครั้งภายในวันเดียว
หลายประเด็นในการค้นหาต้นฉบับไม่พบการยืนยันจากแหล่งที่มาโดยตรงจนถึงช่วงต้นเดือนมิถุนายน 2026:
ธีมหลักของสัปดาห์แรกของเดือนมิถุนายน 2026 คือ เครื่องมือระดับองค์กร (ปลั๊กอิน Codex และ Sites), ตระกูลโมเดลที่พัฒนาขึ้นภายใน (กลุ่มผลิตภัณฑ์ MAI ของ Microsoft, Qwen ของ Alibaba), วุฒิภาวะของเอเจนต์โอเพนซอร์ส (Hermes Desktop) และการมาถึงของคนรุ่นใหม่ที่ยังไม่ได้เผยแพร่ต่อสาธารณะ (GPT‑5.6, Claude Mythos) อุตสาหกรรมกำลังก้าวไปอย่างรวดเร็ว—แต่เส้นแบ่งระหว่างผลิตภัณฑ์ที่ยืนยันแล้วกับข่าวลือที่ยังไม่ได้รับการยืนยันนั้นคมชัดเกินกว่าที่พาดหัวข่าวมักจะสื่อออกมา
Comments
0 comments