OpenAI prepara o GPT Bidi 1, um modelo de voz bidirecional que permite ao ChatGPT ouvir e falar simultaneamente, sem travamentos ao ser interrompido. Descoberto por desenvolvedores em junho de 2026, o modelo promete conversas mais naturais e introduz três níveis de inteligência: High, Medium e Instant.

Create a landscape editorial hero image for this Studio Global article: Search & fact-check with cited sources for What is OpenAI's GPT-Bidi-1 bidirectional voice model for ChatGPT, including how it was discovere. Article summary: OpenAI's **GPT-Bidi-1** is a next-generation bidirectional voice model for ChatGPT, discovered via code and UI references in the ChatGPT web and mobile apps. It represents the largest voice-mode upgrade ever for ChatGPT,. Topic tags: general, general web, user generated. Style: premium digital editorial illustration, source-backed research mood, clean composition, high detail, modern web publication hero. Use reference image context only for broad subject, composition, and topical grounding; do not copy the exact image. Avoid: logos, brand marks, copyrighted characters, real person likenesses, fake screenshots, UI text, readable text, watermarks, charts with fa
A OpenAI está preparando a maior atualização do sistema de voz do ChatGPT até hoje: um modelo de áudio bidirecional chamado internamente de GPT-Bidi-1. Diferente de todos os modos de voz anteriores do ChatGPT, que esperam o usuário terminar de falar para responder, o GPT-Bidi-1 consegue ouvir e falar ao mesmo tempo — absorvendo interrupções, corrigindo erros em tempo real e ajustando suas respostas sem perder o fluxo do áudio.
Este artigo explica como o GPT-Bidi-1 foi descoberto, o que o diferencia dos modos de voz tradicionais, os três níveis de inteligência que ele introduz, a mudança visual na interface do ChatGPT e o contexto competitivo de seu desenvolvimento. Vale lembrar que o modelo ainda não foi anunciado oficialmente pela OpenAI; todas as informações vêm de vestígios em códigos, referências na interface, relatos de usuários e análises da imprensa.
A descoberta começou com o desenvolvedor M1Astra, que encontrou referências ao gpt-bidi-1 no código do aplicativo do ChatGPT e compartilhou a novidade no X (antigo Twitter). Em seguida, o site de monitoramento TestingCatalog confirmou a existência do modelo, junto com um texto que descrevia "a próxima geração do Voice" e um "grande salto em inteligência".
Elementos de código e de interface foram encontrados tanto na versão web quanto no aplicativo mobile do ChatGPT. Testes limitados começaram a ser liberados para um pequeno grupo de usuários no final de junho de 2026. Entre os dias 22 e 24 de junho de 2026, vários relatos de usuários e vídeos de demonstração surgiram, mostrando o modelo funcionando na prática de forma bidirecional.
Importante: a OpenAI não emitiu nenhum comunicado oficial. O nome final do modelo, o comportamento exato dos seus níveis e a data de lançamento ainda não foram confirmados pela empresa.
Os modos de voz atuais do ChatGPT — Voz Padrão e Modo de Voz Avançado — funcionam em um esquema de turnos. O modelo precisa esperar o usuário terminar de falar para poder responder. A arquitetura bidirecional (BiDi) do GPT-Bidi-1 permite que o modelo processe dois fluxos de áudio simultaneamente: o seu e o dele próprio.
As principais diferenças de comportamento observadas nas demonstrações:
O objetivo interno da OpenAI era diminuir a diferença entre o sistema de voz do ChatGPT — que estava atrás de seus modelos de texto (que já operam com raciocínio equivalente ao GPT-5.5) — e oferecer paridade de inteligência em conversas em tempo real.
O GPT-Bidi-1 é o primeiro modelo de voz da OpenAI a introduzir três níveis selecionáveis de inteligência e velocidade para o modo de voz:
| Nível | Descrição |
|---|---|
| High | Máxima profundidade de raciocínio, resposta mais lenta — ideal para análises complexas |
| Medium | Equilíbrio entre inteligência e velocidade |
| Instant | Resposta mais rápida possível, raciocínio reduzido — para interações casuais ou que exigem agilidade |
Esse sistema de níveis permite que o usuário ajuste a profundidade da interação versus a latência para cada tarefa, de forma parecida com os diferentes níveis de raciocínio oferecidos nos modelos de texto do ChatGPT. Por exemplo, uma consulta rápida sobre o clima usaria o modo Instant, enquanto uma sessão intensa de brainstorming exigiria o modo High.
Quando o GPT-Bidi-1 é selecionado, o ícone/indicador de onda de voz muda para amarelo, em vez da cor padrão atual. O modelo aparece no seletor de modelos das configurações como uma nova opção chamada "Bidi (Mais Recente)", ao lado dos modos Voz Padrão e Modo de Voz Avançado, sem substituí-los.
gpt-bidi-1. Contexto competitivo: O investimento em voz bidirecional é uma resposta direta aos avanços do Google (Gemini Live, que já lida com interrupções), da Anthropic e de agentes de voz em tempo real de startups. A OpenAI está correndo para equiparar a interação por voz à sua inteligência de texto, que já opera com raciocínio de nível GPT-5.5.
Studio Global AI
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
OpenAI prepara o GPT Bidi 1, um modelo de voz bidirecional que permite ao ChatGPT ouvir e falar simultaneamente, sem travamentos ao ser interrompido.
OpenAI prepara o GPT Bidi 1, um modelo de voz bidirecional que permite ao ChatGPT ouvir e falar simultaneamente, sem travamentos ao ser interrompido. Descoberto por desenvolvedores em junho de 2026, o modelo promete conversas mais naturais e introduz três níveis de inteligência: High, Medium e Instant.
O indicador visual de voz muda para amarelo quando o modo bidirecional é ativado, e a OpenAI busca alcançar a concorrência do Google e da Anthropic.
Loading comments...
Comments
0 comments