GPT Bidi 1 คือโมเดลเสียงแบบสองทาง (Bidirectional) ที่ช่วยให้ ChatGPT ฟังและพูดได้พร้อมกัน โดยไม่ต้องรอให้ผู้ใช้พูดจบก่อน โมเดลนี้รองรับการถูกพูดแทรกกลางคัน และปรับเปลี่ยนคำตอบได้ทันทีโดยไม่สะดุด ผู้ใช้สามารถเลือกระดับความฉลาดได้ 3 ระดับ: High (เน้นลึก), Medium (สมดุล) และ Instant (เร็วที่สุด)

Create a landscape editorial hero image for this Studio Global article: Search & fact-check with cited sources for What is OpenAI's GPT-Bidi-1 bidirectional voice model for ChatGPT, including how it was discovere. Article summary: OpenAI's **GPT-Bidi-1** is a next-generation bidirectional voice model for ChatGPT, discovered via code and UI references in the ChatGPT web and mobile apps. It represents the largest voice-mode upgrade ever for ChatGPT,. Topic tags: general, general web, user generated. Style: premium digital editorial illustration, source-backed research mood, clean composition, high detail, modern web publication hero. Use reference image context only for broad subject, composition, and topical grounding; do not copy the exact image. Avoid: logos, brand marks, copyrighted characters, real person likenesses, fake screenshots, UI text, readable text, watermarks, charts with fa
OpenAI กำลังเตรียมอัปเกรดระบบเสียงของ ChatGPT ครั้งใหญ่ที่สุดด้วยโมเดลเสียงแบบสองทางภายในที่มีชื่อว่า GPT-Bidi-1 ซึ่งแตกต่างจากระบบเสียงรุ่นก่อนๆ ที่ต้องรอให้ผู้ใช้พูดจบก่อน GPT-Bidi-1 สามารถฟังและพูดไปพร้อมกันได้ รองรับการถูกขัดจังหวะ ปรับแก้ข้อมูลแบบเรียลไทม์ และปรับเปลี่ยนคำตอบได้ทันทีโดยไม่สะดุด
การค้นพบเริ่มต้นจากนักพัฒนา M1Astra ที่พบโค้ดอ้างอิง gpt-bidi-1 ในแอป ChatGPT และแชร์บน X ต่อมา TestingCatalog ยืนยันข้อมูลดังกล่าว พร้อมข้อความที่ดูเหมือนจะเป็นข้อความประกาศเกี่ยวกับ "นวัตกรรมเสียงรุ่นต่อไป" และ "ก้าวกระโดดทางความคิด"
หลังจากนั้นก็พบองค์ประกอบของโค้ดและ UI ทั้งบนเว็บและมือถือ และเริ่มมีการทดสอบกับผู้ใช้กลุ่มเล็กๆ ในช่วงปลายเดือนมิถุนายน 2026 ภายในวันที่ 22–24 มิถุนายน 2026 ก็มีรายงานและคลิปวิดีโอจากผู้ใช้จำนวนมากที่แสดงให้เห็นโมเดลนี้ทำงานแบบสองทางได้จริง
ข้อควรระวัง: OpenAI ยังไม่ได้ออกประกาศอย่างเป็นทางการ ชื่อโมเดล พฤติกรรมแต่ละระดับ และวันวางจำหน่ายยังไม่ได้รับการยืนยันจากบริษัท
ระบบเสียงของ ChatGPT ในปัจจุบัน ทั้ง Standard Voice และ Advanced Voice Mode ทำงานแบบ ผลัดกันพูด (turn-based) โดยต้องรอให้ผู้ใช้พูดจบก่อน
ความแตกต่างหลักๆ ที่พบในการสาธิต:
เป้าหมายภายในของ OpenAI คือการลดช่องว่างระหว่างระบบเสียงของ ChatGPT ซึ่งล้าหลังโมเดลข้อความ (ที่ใช้การคิดแบบ GPT-5.5 แล้ว) และมอบความเท่าเทียมด้านความฉลาดในการสนทนาแบบเรียลไทม์
GPT-Bidi-1 เป็นโมเดลเสียงรุ่นแรกของ OpenAI ที่มี สามระดับความฉลาดและความเร็วให้เลือก:
| ระดับ | คำอธิบาย |
|---|---|
| High | ใช้ความคิดลึกสุด ช้าที่สุด สำหรับงานวิเคราะห์ซับซ้อน |
| Medium | สมดุลระหว่างความฉลาดและความเร็ว |
| Instant | ตอบสนองเร็วที่สุด ลดความฉลาด สำหรับการโต้ตอบทั่วไปหรือที่ต้องการความรวดเร็ว |
ระบบระดับนี้ช่วยให้ผู้ใช้ปรับความลึกของการโต้ตอบกับความหน่วงตามแต่ละงานได้ เช่น การถามสภาพอากาศใช้ Instant แต่การระดมสมองเชิงลึกใช้ High
เมื่อเลือก GPT-Bidi-1 ไอคอนเสียงจะเปลี่ยนเป็นสีเหลือง โดยโมเดลจะปรากฏในตัวเลือกโมเดลเป็นตัวเลือกใหม่ชื่อ "Bidi (Latest)" ควบคู่ไปกับ Standard Voice และ Advanced Voice Mode ที่มีอยู่
gpt-bidi-1 ต่อสาธารณะเป็นครั้งแรก บริบทการแข่งขัน: การผลักดันเสียงแบบสองทางนี้เป็นการตอบโต้โดยตรงต่อความก้าวหน้าของ Google (Gemini Live ที่รองรับการขัดจังหวะ), Anthropic และเอเจนต์เสียงจากสตาร์ทอัพต่างๆ OpenAI กำลังแข่งเพื่อนำความเท่าเทียมด้านการโต้ตอบด้วยเสียงมาสู่ความฉลาดด้านข้อความ ซึ่งอยู่ในระดับ GPT-5.5
Studio Global AI
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
GPT Bidi 1 คือโมเดลเสียงแบบสองทาง (Bidirectional) ที่ช่วยให้ ChatGPT ฟังและพูดได้พร้อมกัน โดยไม่ต้องรอให้ผู้ใช้พูดจบก่อน
GPT Bidi 1 คือโมเดลเสียงแบบสองทาง (Bidirectional) ที่ช่วยให้ ChatGPT ฟังและพูดได้พร้อมกัน โดยไม่ต้องรอให้ผู้ใช้พูดจบก่อน โมเดลนี้รองรับการถูกพูดแทรกกลางคัน และปรับเปลี่ยนคำตอบได้ทันทีโดยไม่สะดุด
ผู้ใช้สามารถเลือกระดับความฉลาดได้ 3 ระดับ: High (เน้นลึก), Medium (สมดุล) และ Instant (เร็วที่สุด)
Loading comments...
Comments
0 comments