Zastrzeżenie: OpenAI nie wydało oficjalnego komunikatu. Ostateczna nazwa modelu, dokładne działanie poziomów ani data premiery nie zostały potwierdzone przez firmę.
Obecne tryby głosowe ChatGPT – Standardowy Głos i Zaawansowany Tryb Głosowy – działają w paradygmacie naprzemiennym (turn-based). Model musi poczekać, aż użytkownik skończy mówić, zanim odpowie. Dwukierunkowa (BiDi) architektura GPT-Bidi-1 pozwala na jednoczesne przetwarzanie dwóch strumieni audio: użytkownika i własnego.
Najważniejsze różnice widoczne w testach:
Wewnętrznym celem OpenAI było zniwelowanie luki między możliwościami głosowymi ChatGPT a jego modelami tekstowymi (które już osiągnęły poziom wnioskowania GPT-5.5).
| Poziom | Opis |
|---|---|
| Wysoki (High) | Maksymalna głębia wnioskowania, wolniejsza odpowiedź – do złożonych analiz |
| Średni (Medium) | Równowaga między inteligencją a szybkością |
| Natychmiastowy (Instant) | Najszybsza odpowiedź, ograniczone wnioskowanie – do prostych, codziennych pytań |
System poziomów pozwala dostosować głębokość interakcji do zadania: szybkie pytanie o pogodę uruchomi tryb Instant, a burza mózgów – Wysoki.
Po wybraniu GPT-Bidi-1 wskaźnik (bańka/fala głosu) zmienia kolor na żółty. Model pojawia się w ustawieniach jako osobna opcja „Bidi (Latest)”, obok Standardowego Głosu i Zaawansowanego Trybu Głosowego – nie zastępuje ich.
gpt-bidi-1.
Comments
0 comments