Varning: OpenAI har inte utfärdat något officiellt tillkännagivande. Modellens slutliga namn, exakta nivåbeteende och lanseringsdatum bekräftas inte av företaget.
Nuvarande ChatGPT-röstlägen — Standard Voice och Advanced Voice Mode — fungerar i ett turordningsbaserat paradigm. Modellen måste vänta på att användaren ska sluta prata innan den kan svara. GPT-Bidi-1:s tvåvägsarkitektur (BiDi) gör att modellen kan bearbeta två ljudströmmar samtidigt: din och sin egen.
Viktiga beteendeskillnader som rapporterats i demonstrationer:
OpenAI:s interna mål var att minska gapet mellan ChatGPT:s röststack — som låg efter dess textmodeller (redan på GPT-5.5-klass resonemang) — och leverera paritet i realtidskonversationsintelligens.
GPT-Bidi-1 är den första OpenAI-röstmodellen som introducerar tre valbara intelligens- och hastighetsnivåer för röst:
| Nivå | Beskrivning |
|---|---|
| High | Maximal resonemangsdjup, långsammare svar – för komplexa analysuppgifter |
| Medium | Balanserad avvägning mellan intelligens och hastighet |
| Instant | Snabbast möjliga svar, reducerat resonemang – för vardagliga eller tidskänsliga interaktioner |
Nivåsystemet låter användare skräddarsy interaktionsdjup kontra latens per uppgift, liknande hur ChatGPT:s textmodeller erbjuder olika resonemangsnivåer. Till exempel skulle en snabb väderfråga använda Instant, medan en djup brainstorming-session skulle växla till High.
När GPT-Bidi-1 är vald ändras röstbubblan/vågformindikatorn till gul istället för den nuvarande standardfärgen. Modellen visas i inställningarnas modellväljare som ett nytt alternativ märkt "Bidi (Latest)" tillsammans med befintliga Standard Voice och Advanced Voice Mode, snarare än att ersätta dem.
gpt-bidi-1.
Comments
0 comments