GPT Bidi 1 係 OpenAI 新一代雙向語音模型,容許 ChatGPT 同時聽同講,唔使再等對方講完先回應。 呢個模型可以喺對話中途吸收你嘅打斷,實時調整回應,唔會 freeze 或者斷聲。 首度引入 High、Medium、Instant 三種智能速度級別,畀你用家按需要揀深度定快慢。

Create a landscape editorial hero image for this Studio Global article: Search & fact-check with cited sources for What is OpenAI's GPT-Bidi-1 bidirectional voice model for ChatGPT, including how it was discovere. Article summary: OpenAI's **GPT-Bidi-1** is a next-generation bidirectional voice model for ChatGPT, discovered via code and UI references in the ChatGPT web and mobile apps. It represents the largest voice-mode upgrade ever for ChatGPT,. Topic tags: general, general web, user generated. Style: premium digital editorial illustration, source-backed research mood, clean composition, high detail, modern web publication hero. Use reference image context only for broad subject, composition, and topical grounding; do not copy the exact image. Avoid: logos, brand marks, copyrighted characters, real person likenesses, fake screenshots, UI text, readable text, watermarks, charts with fa
OpenAI 準備緊佢哋有史以來最大規模嘅 ChatGPT 語音升級:一個內部叫做 GPT-Bidi-1 嘅雙向音訊模型。同之前所有嘅 ChatGPT 語音模式唔同,GPT-Bidi-1 可以同一時間聽同講——吸收你嘅打斷、即時修正錯處,仲會調整回應而唔會 cut 咗條音軌。
呢篇文章會講吓 GPT-Bidi-1 係點樣被發現、佢同傳統輪住講嘅語音模式有咩分別、佢引入嘅三個智能級別、ChatGPT 介面嘅視覺改變,同埋佢嘅開發背景同競爭形勢。呢個模型仲未被 OpenAI 官方正式公布,所以所有細節都嚟自程式碼、UI 參考、用戶報告同媒體分析。
呢條發現鏈由開發者 M1Astra 開始,佢首先喺 ChatGPT 嘅應用程式碼入面見到 gpt-bidi-1 嘅參考,然後喺 X 上面分享咗。跟住追蹤網站 TestingCatalog 確認咗呢個模型字串,仲見到有公告文字形容係「下一代 Voice」同「智能嘅重大躍進」。
之後喺網頁版同手機版嘅 ChatGPT 客戶端都搵到代碼同 UI 元素。到 2026 年 6 月下旬,有一小部分用戶開始收到有限度測試。 去到 2026 年 6 月 22 至 24 號,出現咗好多用戶報告同示範影片,顯示個模型實際上係雙向運作緊。
留意:OpenAI 官方仲未正式公布。模型最終名稱、實際級別行為同推出日期都未被公司確認。
現時 ChatGPT 嘅語音模式——標準語音同進階語音模式——都係 輪住講 嘅:模型要等你講完先可以回應。GPT-Bidi-1 嘅雙向(BiDi)架構就容許模型同時處理兩條音訊流:你嗰條同佢自己嗰條。
示範入面見到嘅主要行為分別:
OpenAI 嘅內部目標係要拉近 ChatGPT 語音技術(落後於已經去到 GPT-5.5 級推理嘅文字模型)同即時對話智能之間嘅差距。
GPT-Bidi-1 係第一個喺語音層面引入 三個可揀嘅智能同速度級別 嘅 OpenAI 語音模型:
| 級別 | 說明 |
|---|---|
| High(高) | 最高推理深度,回應較慢——適合複雜分析任務 |
| Medium(中) | 智能同速度之間嘅平衡取捨 |
| Instant(即時) | 最快回應,推理較少——適合 casual 或者爭分奪秒嘅互動 |
呢個級別系統畀你用家按任務需要調校互動深度同延遲,就好似 ChatGPT 文字模型提供唔同推理級別咁。 例如,問天氣呢啲快嘢就用 Instant,深度腦力激盪就轉做 High。
揀咗 GPT-Bidi-1 之後,語音泡泡/波形指示器會變成黃色,唔係平時嘅預設顏色。 個模型會喺設定嘅模型選擇器入面出現,標示為 「Bidi (最新)」,同現有嘅標準語音同進階語音模式並列,而唔係取代佢哋。
gpt-bidi-1 嘅程式碼參考。競爭背景:呢次雙向語音嘅推進,直接回應咗 Google(Gemini Live 可以打斷)、Anthropic 同多間初创公司嘅即時語音助手嘅進步。OpenAI 正爭取令語音互動追上已經有 GPT-5.5 級推理能力嘅文字智能。
Studio Global AI
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
GPT Bidi 1 係 OpenAI 新一代雙向語音模型,容許 ChatGPT 同時聽同講,唔使再等對方講完先回應。
GPT Bidi 1 係 OpenAI 新一代雙向語音模型,容許 ChatGPT 同時聽同講,唔使再等對方講完先回應。 呢個模型可以喺對話中途吸收你嘅打斷,實時調整回應,唔會 freeze 或者斷聲。
首度引入 High、Medium、Instant 三種智能速度級別,畀你用家按需要揀深度定快慢。
Loading comments...
Comments
0 comments