Koodi- ja käyttöliittymäelementtejä löydettiin myöhemmin sekä verkko- että mobiili-ChatGPT-sovelluksista. Rajoitettuja testejä alettiin jakaa pienelle käyttäjäjoukolle kesäkuun 2026 lopulla. Kesäkuun 22.–24. päivänä 2026 ilmestyi useita käyttäjäraportteja ja esittelyvideoita, jotka osoittivat mallin toimivan kaksisuuntaisesti käytännössä.
Huomautus: OpenAI ei ole antanut virallista ilmoitusta. Mallin lopullinen nimi, tarkka tasojen käyttäytyminen ja julkaisupäivä ovat yhä vahvistamatta yrityksen toimesta.
Nykyiset ChatGPT:n äänitilat – Standard Voice ja Advanced Voice Mode – toimivat vuoropohjaisessa paradigmassa. Mallin on odotettava, että käyttäjä lopettaa puhumisen ennen kuin se voi vastata. GPT-Bidi-1:n kaksisuuntainen (BiDi) arkkitehtuuri mahdollistaa sen, että malli käsittelee kahta äänivirtaa samanaikaisesti: sinun ja oman äänesi.
Keskeiset käyttäytymiserot, joita on raportoitu esittelyissä:
OpenAI:n sisäinen tavoite oli kuroa umpeen ChatGPT:n äänipinon – joka oli jäljessä sen tekstimalleista (jotka olivat jo GPT-5.5-luokan päättelykyvyssä) – ja tarjota reaaliaikaisen keskustelun älykkyyden pariteetti.
GPT-Bidi-1 on ensimmäinen OpenAI:n äänimalli, joka esittelee kolme valittavaa älykkyys- ja nopeustasoa äänelle:
| Taso | Kuvaus |
|---|---|
| High | Maksimaalinen päättelysyvyys, hitaampi vaste – monimutkaisiin analyysitehtäviin |
| Medium | Tasapainoinen kompromissi älykkyyden ja nopeuden välillä |
| Instant | Nopein mahdollinen vaste, vähemmän päättelyä – satunnaisiin tai aikakriittisiin vuorovaikutuksiin |
Tasojärjestelmä antaa käyttäjien räätälöidä vuorovaikutuksen syvyyttä ja latenssia tehtävän mukaan, samalla tavalla kuin ChatGPT:n tekstimallit tarjoavat eri päättelytasoja. Esimerkiksi nopea säätiedustelu käyttäisi Instant-tasoa, kun taas syvällinen aivoriihi vaihtaisi High-tasoon.
Kun GPT-Bidi-1 on valittuna, äänikuplan/aaltomuotoilmaisimen väri vaihtuu keltaiseksi nykyisen oletusvärin sijaan. Malli näkyy asetusten mallivalitsimessa uutena vaihtoehtona, joka on nimetty "Bidi (Latest)":ksi ja se on olemassa olevien Standard Voice- ja Advanced Voice Mode -tilojen rinnalla, ei niiden korvaajana.
gpt-bidi-1:een. Kilpailukonteksti: Kaksisuuntainen äänipanos vastaa suoraan edistysaskeleisiin, joita Google (Gemini Live keskeytyksineen), Anthropic ja startup-yritysten reaaliaikaiset ääniagentit ovat tehneet. OpenAI kilpailee tuodakseen äänivuorovaikutuksen pariteetin tekstin älykkyydelleen, joka jo ohjaa GPT-5.5-tason päättelyä.
Comments
0 comments