What should I do next in practice?

GPT Bidi 1 introducerar tre valbara intelligensnivåer: High, Medium och Instant – för att balansera svarshastighet och djup.

← Back to Trending

AnswersPublished11 hours agoLast edited 10 hours ago23 sources

GPT-Bidi-1: OpenAI:s banbrytande röstmodell för ChatGPT

OpenAI:s GPT Bidi 1 är en nästa generations tvåvägs röstmodell som låter ChatGPT lyssna och prata samtidigt, och hantera avbrott mitt i en mening utan att frysa. Modellen upptäcktes i ChatGPT:s appkod av utvecklaren M1Astra och bekräftades av TestingCatalog i juni 2026.

Search & fact-check with Studio Global AI Browse more Trending pages

14K0

OpenAI's ChatGPT GPT-Bidi-1 bidirectional voice model concept illustration — Search & fact-check with cited sources for What is OpenAI's GPT-Bidi-1 bidirectional voice model for ChatGPT, including how it was discovereConceptual representation of OpenAI's next-generation bidirectional voice model, GPT-Bidi-1, for ChatGPT.
AI Prompt
Create a landscape editorial hero image for this Studio Global article: Search & fact-check with cited sources for What is OpenAI's GPT-Bidi-1 bidirectional voice model for ChatGPT, including how it was discovere. Article summary: OpenAI's **GPT-Bidi-1** is a next-generation bidirectional voice model for ChatGPT, discovered via code and UI references in the ChatGPT web and mobile apps. It represents the largest voice-mode upgrade ever for ChatGPT,. Topic tags: general, general web, user generated. Style: premium digital editorial illustration, source-backed research mood, clean composition, high detail, modern web publication hero. Use reference image context only for broad subject, composition, and topical grounding; do not copy the exact image. Avoid: logos, brand marks, copyrighted characters, real person likenesses, fake screenshots, UI text, readable text, watermarks, charts with fa
openai.com

OpenAI förbereder sin största röstuppgradering hittills för ChatGPT: en tvåvägs ljudmodell internt kallad GPT-Bidi-1. Till skillnad från alla tidigare röstlägen för ChatGPT, som väntar på att användaren ska sluta prata innan den svarar, kan GPT-Bidi-1 lyssna och prata samtidigt – absorbera avbrott, korrigera misstag i realtid och justera sina svar utan att tappa ljudspåret.

Denna artikel täcker hur GPT-Bidi-1 upptäcktes, vad som skiljer den från turordningsbaserad röst, de tre intelligensnivåer den introducerar, den visuella förändringen av ChatGPT-gränssnittet och den konkurrensutsatta kontexten för dess utveckling. Modellen har inte officiellt tillkännages av OpenAI, så alla detaljer kommer från kodfynd, UI-referenser, användarrapporter och medieanalys.

Hur GPT-Bidi-1 upptäcktes

Upptäcktskedjan började med utvecklaren M1Astra, som först såg referenser till gpt-bidi-1 i ChatGPT:s appkod och delade fyndet på X. Spårningssajten TestingCatalog bekräftade sedan modellsträngen, tillsammans med vad som såg ut att vara tillkännagivandetext som beskrev "nästa generation av Voice" och ett "stort språng inom intelligens."

Kod och UI-element hittades därefter på både webb- och mobilklienter för ChatGPT. Begränsade tester började flöda till en liten delmängd användare i slutet av juni 2026. Den 22–24 juni 2026 dök flera användarrapporter och demonstrationsvideor upp som visade modellen fungera tvåvägs i praktiken.

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Nivå	Beskrivning
High	Maximal resonemangsdjup, långsammare svar – för komplexa analysuppgifter
Medium	Balanserad avvägning mellan intelligens och hastighet
Instant	Snabbast möjliga svar, reducerat resonemang – för vardagliga eller tidskänsliga interaktioner

GPT-Bidi-1: OpenAI:s banbrytande röstmodell för ChatGPT

Hur GPT-Bidi-1 upptäcktes

Search, cite, and publish your own answer

People also ask

What is the short answer to "GPT-Bidi-1: OpenAI:s banbrytande röstmodell för ChatGPT"?

What are the key points to validate first?

What should I do next in practice?

Sources

Comments

Hur tvåvägs röst skiljer sig från turordningsbaserade modeller

Tre valbara intelligensnivåer

Visuella förändringar i röstgränssnittet

Utvecklingstidslinje och konkurrenskontext