OpenAI připravuje GPT Bidi 1, obousměrný hlasový model, který umí zároveň naslouchat i mluvit a reagovat na přerušení během věty. Model byl objeven v kódu ChatGPT díky vývojáři M1Astra a serveru TestingCatalog; oficiální oznámení zatím nepadlo.

Create a landscape editorial hero image for this Studio Global article: Search & fact-check with cited sources for What is OpenAI's GPT-Bidi-1 bidirectional voice model for ChatGPT, including how it was discovere. Article summary: OpenAI's **GPT-Bidi-1** is a next-generation bidirectional voice model for ChatGPT, discovered via code and UI references in the ChatGPT web and mobile apps. It represents the largest voice-mode upgrade ever for ChatGPT,. Topic tags: general, general web, user generated. Style: premium digital editorial illustration, source-backed research mood, clean composition, high detail, modern web publication hero. Use reference image context only for broad subject, composition, and topical grounding; do not copy the exact image. Avoid: logos, brand marks, copyrighted characters, real person likenesses, fake screenshots, UI text, readable text, watermarks, charts with fa
OpenAI připravuje vůbec největší upgrade hlasového režimu pro ChatGPT: obousměrný audio model s interním označením GPT-Bidi-1. Na rozdíl od všech dosavadních hlasových režimů ChatGPT, které čekají, až uživatel domluví, než začnou odpovídat, GPT-Bidi-1 umí poslouchat a mluvit zároveň – vstřebává přerušení, v reálném čase opravuje chyby a přizpůsobuje své odpovědi, aniž by došlo k výpadku audia.
Tento článek shrnuje, jak byl GPT-Bidi-1 objeven, čím se liší od stávajících hlasových režimů, jaké tři úrovně inteligence zavádí, jak se změní vizuální podoba rozhraní a v jakém konkurenčním kontextu vzniká. Model zatím nebyl oficiálně oznámen společností OpenAI – všechny informace pocházejí z nálezů v kódu, zmínek v uživatelském rozhraní, reportů uživatelů a analýz médií.
Řetězec objevu odstartoval vývojář M1Astra, který jako první narazil na reference na gpt-bidi-1 v kódu aplikace ChatGPT a sdílel svůj nález na síti X. Server TestingCatalog následně potvrdil výskyt tohoto modelového řetězce spolu s textem, který model popisoval jako „další generaci hlasu“ a „zásadní skok v inteligenci“.
Kód a prvky rozhraní byly následně nalezeny jak ve webové, tak v mobilní verzi ChatGPT. Koncem června 2026 začaly omezené testy proudit k malé skupině uživatelů. Mezi 22. a 24. červnem 2026 se pak objevilo několik uživatelských reportů a demonstračních videí, která ukazovala model v praxi – včetně obousměrné komunikace.
Důležité upozornění: OpenAI nevydala žádné oficiální oznámení. Konečný název modelu, přesné chování jednotlivých úrovní ani datum uvedení nebyly společností potvrzeny.
Současné hlasové režimy ChatGPT – Standard Voice a Advanced Voice Mode – fungují na principu střídání se v rozhovoru. Model musí počkat, až uživatel domluví, a teprve pak může odpovědět. Obousměrná (BiDi) architektura modelu GPT-Bidi-1 umožňuje zpracovávat dva audio proudy současně: ten váš i svůj vlastní.
Klíčové rozdíly v chování, které byly zaznamenány v demonstracích:
Interním cílem OpenAI bylo překlenout propast mezi hlasovou částí ChatGPT – která zaostávala za textovými modely (již na úrovni uvažování GPT-5.5) – a dosáhnout parity v inteligenci v reálném čase.
GPT-Bidi-1 je prvním hlasovým modelem OpenAI, který zavádí tři volitelné úrovně inteligence a rychlosti pro hlasové ovládání:
| Úroveň | Popis |
|---|---|
| High | Maximální hloubka uvažování, pomalejší odezva – pro komplexní analytické úkoly |
| Medium | Vyvážený kompromis mezi inteligencí a rychlostí |
| Instant | Nejrychlejší možná odezva, omezené uvažování – pro běžné nebo časově náročné interakce |
Tento systém úrovní umožňuje uživatelům přizpůsobit hloubku interakce versus rychlost podle konkrétního úkolu – podobně jako u textových modelů ChatGPT, které nabízejí různé úrovně uvažování. Například rychlý dotaz na počasí by využil úroveň Instant, zatímco hloubková diskuze nebo brainstorming by přepnul na úroveň High.
Po výběru modelu GPT-Bidi-1 se indikátor hlasové bubliny/vlny změní na žlutou barvu namísto stávající výchozí. Model se v nastavení model-selectoru objeví jako nová možnost s označením „Bidi (Latest)“ vedle stávajících Standard Voice a Advanced Voice Mode, nikoli jako jejich náhrada.
gpt-bidi-1. Konkurenční kontext: Tlak na obousměrný hlas je přímou reakcí na pokroky společnosti Google (Gemini Live s podporou přerušení), Anthropicu a real-time hlasových agentů od startupů. OpenAI se snaží dohnat paritu v hlasové interakci s ohledem na svou textovou inteligenci, která již pohání uvažování na úrovni GPT-5.5.
Studio Global AI
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
OpenAI připravuje GPT Bidi 1, obousměrný hlasový model, který umí zároveň naslouchat i mluvit a reagovat na přerušení během věty.
OpenAI připravuje GPT Bidi 1, obousměrný hlasový model, který umí zároveň naslouchat i mluvit a reagovat na přerušení během věty. Model byl objeven v kódu ChatGPT díky vývojáři M1Astra a serveru TestingCatalog; oficiální oznámení zatím nepadlo.
Na rozdíl od stávajících režimů (Standard Voice, Advanced Voice) zvládá BiDi model zpracovávat dva audio proudy současně.
Loading comments...
Comments
0 comments