คำตอบเผยแพร่แล้ว12 ชั่วโมงที่ผ่านมาLast edited 11 ชั่วโมงที่ผ่านมา23 แหล่งที่มา

GPT-Bidi-1: OpenAI เปิดตัวโมเดลเสียงสองทางรุ่นใหม่ล่าสุดสำหรับ ChatGPT คุยได้แบบไม่ต้องรอ

GPT Bidi 1 คือโมเดลเสียงแบบสองทาง (Bidirectional) ที่ช่วยให้ ChatGPT ฟังและพูดได้พร้อมกัน โดยไม่ต้องรอให้ผู้ใช้พูดจบก่อน โมเดลนี้รองรับการถูกพูดแทรกกลางคัน และปรับเปลี่ยนคำตอบได้ทันทีโดยไม่สะดุด ผู้ใช้สามารถเลือกระดับความฉลาดได้ 3 ระดับ: High (เน้นลึก), Medium (สมดุล) และ Instant (เร็วที่สุด)

ค้นหาและตรวจสอบข้อเท็จจริงด้วย Studio Global AI ดูหน้าที่กำลังมาแรงเพิ่มเติม

9.0K0

OpenAI's ChatGPT GPT-Bidi-1 bidirectional voice model concept illustration — Search & fact-check with cited sources for What is OpenAI's GPT-Bidi-1 bidirectional voice model for ChatGPT, including how it was discovereConceptual representation of OpenAI's next-generation bidirectional voice model, GPT-Bidi-1, for ChatGPT.
AI พรอมต์
Create a landscape editorial hero image for this Studio Global article: Search & fact-check with cited sources for What is OpenAI's GPT-Bidi-1 bidirectional voice model for ChatGPT, including how it was discovere. Article summary: OpenAI's **GPT-Bidi-1** is a next-generation bidirectional voice model for ChatGPT, discovered via code and UI references in the ChatGPT web and mobile apps. It represents the largest voice-mode upgrade ever for ChatGPT,. Topic tags: general, general web, user generated. Style: premium digital editorial illustration, source-backed research mood, clean composition, high detail, modern web publication hero. Use reference image context only for broad subject, composition, and topical grounding; do not copy the exact image. Avoid: logos, brand marks, copyrighted characters, real person likenesses, fake screenshots, UI text, readable text, watermarks, charts with fa
openai.com

OpenAI กำลังเตรียมอัปเกรดระบบเสียงของ ChatGPT ครั้งใหญ่ที่สุดด้วยโมเดลเสียงแบบสองทางภายในที่มีชื่อว่า GPT-Bidi-1 ซึ่งแตกต่างจากระบบเสียงรุ่นก่อนๆ ที่ต้องรอให้ผู้ใช้พูดจบก่อน GPT-Bidi-1 สามารถฟังและพูดไปพร้อมกันได้ รองรับการถูกขัดจังหวะ ปรับแก้ข้อมูลแบบเรียลไทม์ และปรับเปลี่ยนคำตอบได้ทันทีโดยไม่สะดุด

ถูกค้นพบได้อย่างไร?

การค้นพบเริ่มต้นจากนักพัฒนา M1Astra ที่พบโค้ดอ้างอิง gpt-bidi-1 ในแอป ChatGPT และแชร์บน X ต่อมา TestingCatalog ยืนยันข้อมูลดังกล่าว พร้อมข้อความที่ดูเหมือนจะเป็นข้อความประกาศเกี่ยวกับ "นวัตกรรมเสียงรุ่นต่อไป" และ "ก้าวกระโดดทางความคิด"

หลังจากนั้นก็พบองค์ประกอบของโค้ดและ UI ทั้งบนเว็บและมือถือ และเริ่มมีการทดสอบกับผู้ใช้กลุ่มเล็กๆ ในช่วงปลายเดือนมิถุนายน 2026 ภายในวันที่ 22–24 มิถุนายน 2026 ก็มีรายงานและคลิปวิดีโอจากผู้ใช้จำนวนมากที่แสดงให้เห็นโมเดลนี้ทำงานแบบสองทางได้จริง

ข้อควรระวัง: OpenAI ยังไม่ได้ออกประกาศอย่างเป็นทางการ ชื่อโมเดล พฤติกรรมแต่ละระดับ และวันวางจำหน่ายยังไม่ได้รับการยืนยันจากบริษัท

แตกต่างจากโมเดลแบบ Turn-Based อย่างไร?

ระบบเสียงของ ChatGPT ในปัจจุบัน ทั้ง Standard Voice และ Advanced Voice Mode ทำงานแบบ ผลัดกันพูด (turn-based) โดยต้องรอให้ผู้ใช้พูดจบก่อน

ความแตกต่างหลักๆ ที่พบในการสาธิต:

การจัดการกับการขัดจังหวะ: โมเดลสามารถรับการขัดจังหวะกลางประโยคและปรับเปลี่ยนคำตอบได้ทันทีโดยไม่สะดุด
การแก้ไขแบบเรียลไทม์: ในการทดสอบ GPT-Bidi-1 สามารถนับเลข 1 ถึง 10 ไปพร้อมกับผู้ใช้ แล้วเปลี่ยนเป็นนับถอยหลังทันทีเมื่อผู้ใช้พูดแทรก
การพูดซ้อนทับตามธรรมชาติ: ผู้ช่วยสามารถพูดในขณะที่ผู้ใช้ยังพูดอยู่ ทำให้การสนทนาเป็นธรรมชาติมากขึ้น

เป้าหมายภายในของ OpenAI คือการลดช่องว่างระหว่างระบบเสียงของ ChatGPT ซึ่งล้าหลังโมเดลข้อความ (ที่ใช้การคิดแบบ GPT-5.5 แล้ว) และมอบความเท่าเทียมด้านความฉลาดในการสนทนาแบบเรียลไทม์

สามระดับความฉลาดที่เลือกได้

GPT-Bidi-1 เป็นโมเดลเสียงรุ่นแรกของ OpenAI ที่มี สามระดับความฉลาดและความเร็วให้เลือก:

ระดับ	คำอธิบาย
High	ใช้ความคิดลึกสุด ช้าที่สุด สำหรับงานวิเคราะห์ซับซ้อน
Medium	สมดุลระหว่างความฉลาดและความเร็ว
Instant	ตอบสนองเร็วที่สุด ลดความฉลาด สำหรับการโต้ตอบทั่วไปหรือที่ต้องการความรวดเร็ว

ระบบระดับนี้ช่วยให้ผู้ใช้ปรับความลึกของการโต้ตอบกับความหน่วงตามแต่ละงานได้ เช่น การถามสภาพอากาศใช้ Instant แต่การระดมสมองเชิงลึกใช้ High

การเปลี่ยนแปลงอินเทอร์เฟซเสียง

เมื่อเลือก GPT-Bidi-1 ไอคอนเสียงจะเปลี่ยนเป็นสีเหลือง โดยโมเดลจะปรากฏในตัวเลือกโมเดลเป็นตัวเลือกใหม่ชื่อ "Bidi (Latest)" ควบคู่ไปกับ Standard Voice และ Advanced Voice Mode ที่มีอยู่

ไทม์ไลน์และบริบทการแข่งขัน

ต้นปี 2026: OpenAI เริ่มพัฒนา BiDi architecture ภายใน
5 มีนาคม 2026: The Information รายงานว่า OpenAI กำลังพัฒนาโมเดลเสียงสองทางเพื่อเสริมประสิทธิภาพผู้ช่วยเสียง
7 พฤษภาคม 2026: OpenAI ประกาศ GPT-Realtime-2 ใน API ซึ่งเป็นโมเดลเสียงรุ่นแรกที่ใช้การคิดแบบ GPT-5 และเป็นพื้นฐานสำหรับความสามารถแบบสองทาง
16–17 มิถุนายน 2026: M1Astra และ TestingCatalog พบโค้ดอ้างอิง gpt-bidi-1 ต่อสาธารณะเป็นครั้งแรก
22–24 มิถุนายน 2026: มีรายงานและคลิปวิดีโอจากผู้ใช้ที่แสดงการทำงานแบบสองทาง สื่อหลายแห่งคาดว่าการเปิดตัวในวงกว้างอาจเกิดขึ้นในสัปดาห์เดียวกัน

บริบทการแข่งขัน: การผลักดันเสียงแบบสองทางนี้เป็นการตอบโต้โดยตรงต่อความก้าวหน้าของ Google (Gemini Live ที่รองรับการขัดจังหวะ), Anthropic และเอเจนต์เสียงจากสตาร์ทอัพต่างๆ OpenAI กำลังแข่งเพื่อนำความเท่าเทียมด้านการโต้ตอบด้วยเสียงมาสู่ความฉลาดด้านข้อความ ซึ่งอยู่ในระดับ GPT-5.5

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

ค้นหาและตรวจสอบข้อเท็จจริงด้วย Studio Global AI

คนยังถาม

คำตอบสั้น ๆ สำหรับ "GPT-Bidi-1: OpenAI เปิดตัวโมเดลเสียงสองทางรุ่นใหม่ล่าสุดสำหรับ ChatGPT คุยได้แบบไม่ต้องรอ" คืออะไร

GPT Bidi 1 คือโมเดลเสียงแบบสองทาง (Bidirectional) ที่ช่วยให้ ChatGPT ฟังและพูดได้พร้อมกัน โดยไม่ต้องรอให้ผู้ใช้พูดจบก่อน

ประเด็นสำคัญที่ต้องตรวจสอบก่อนคืออะไร?

ฉันควรทำอย่างไรต่อไปในทางปฏิบัติ?

ผู้ใช้สามารถเลือกระดับความฉลาดได้ 3 ระดับ: High (เน้นลึก), Medium (สมดุล) และ Instant (เร็วที่สุด)

แหล่งที่มา

Comments

0 comments

Loading comments...

← Back to Trending