GPT Bidi 1 adalah model suara dua arah generasi terbaru dari OpenAI yang memungkinkan ChatGPT mendengar dan berbicara secara bersamaan, mampu menangani interupsi di tengah kalimat tanpa jeda atau error.

Create a landscape editorial hero image for this Studio Global article: Search & fact-check with cited sources for What is OpenAI's GPT-Bidi-1 bidirectional voice model for ChatGPT, including how it was discovere. Article summary: OpenAI's **GPT-Bidi-1** is a next-generation bidirectional voice model for ChatGPT, discovered via code and UI references in the ChatGPT web and mobile apps. It represents the largest voice-mode upgrade ever for ChatGPT,. Topic tags: general, general web, user generated. Style: premium digital editorial illustration, source-backed research mood, clean composition, high detail, modern web publication hero. Use reference image context only for broad subject, composition, and topical grounding; do not copy the exact image. Avoid: logos, brand marks, copyrighted characters, real person likenesses, fake screenshots, UI text, readable text, watermarks, charts with fa
OpenAI sedang mempersiapkan upgrade suara terbesar untuk ChatGPT: model audio dua arah (bidirectional) yang diberi kode nama GPT-Bidi-1. Berbeda dengan mode suara ChatGPT sebelumnya yang hanya bisa merespons setelah pengguna selesai bicara, GPT-Bidi-1 bisa mendengar dan berbicara secara bersamaan — mampu menyerap interupsi, mengoreksi kesalahan secara real-time, dan menyesuaikan jawaban tanpa memutus alur audio.
Artikel ini membahas bagaimana GPT-Bidi-1 ditemukan, apa yang membedakannya dari model suara bergiliran sebelumnya, tiga tingkat kecerdasan yang diperkenalkan, perubahan visual pada antarmuka ChatGPT, serta konteks persaingan pengembangannya. Perlu dicatat: model ini belum diumumkan secara resmi oleh OpenAI. Seluruh informasi berasal dari kode yang bocor, referensi antarmuka, laporan pengguna, dan analisis media.
Rantai penemuan dimulai dari developer M1Astra, yang pertama kali melihat referensi gpt-bidi-1 dalam kode aplikasi ChatGPT dan membagikannya di platform X. Situs pelacak TestingCatalog kemudian mengonfirmasi string model tersebut, lengkap dengan teks pengumuman yang menyebut "generasi berikutnya dari Voice" dan "lompatan besar dalam kecerdasan."
Elemen kode dan antarmuka kemudian ditemukan di klien web dan mobile ChatGPT. Uji coba terbatas mulai mengalir ke sekelompok kecil pengguna pada akhir Juni 2026. Pada 22–24 Juni 2026, muncul laporan dari pengguna dan video demonstrasi yang menunjukkan model ini bekerja secara dua arah.
Catatan: OpenAI belum mengeluarkan pengumuman resmi. Nama akhir model, perilaku tingkat kecerdasan, dan tanggal peluncuran masih belum dikonfirmasi oleh perusahaan.
Mode suara ChatGPT saat ini — Standard Voice dan Advanced Voice Mode — beroperasi secara bergiliran. Model harus menunggu pengguna selesai bicara sebelum bisa merespons. Arsitektur bidirectional (BiDi) dari GPT-Bidi-1 memungkinkan model memproses dua aliran audio secara simultan: suara Anda dan suaranya sendiri.
Perbedaan perilaku utama yang terlihat dalam demonstrasi:
Tujuan internal OpenAI adalah menutup kesenjangan antara tumpukan suara ChatGPT — yang tertinggal dari model teksnya (sudah mencapai penalaran setara GPT-5.5) — dan memberikan kesetaraan dalam kecerdasan percakapan real-time.
GPT-Bidi-1 adalah model suara OpenAI pertama yang memperkenalkan tiga tingkat kecerdasan dan kecepatan yang bisa dipilih untuk suara:
| Tingkat | Deskripsi |
|---|---|
| High (Tinggi) | Kedalaman penalaran maksimal, respons lebih lambat — untuk tugas analisis kompleks |
| Medium (Sedang) | Keseimbangan antara kecerdasan dan kecepatan |
| Instant (Instan) | Respons tercepat, penalaran dikurangi — untuk interaksi santai atau yang sensitif terhadap waktu |
Sistem tingkat ini memungkinkan pengguna menyesuaikan kedalaman interaksi versus latensi per tugas, mirip dengan model teks ChatGPT yang menawarkan tingkat penalaran berbeda. Misalnya, query cuaca cepat bisa menggunakan Instant, sementara sesi brainstorming mendalam beralih ke High.
Saat GPT-Bidi-1 dipilih, indikator gelembung/gelombang suara berubah menjadi kuning dari warna default saat ini. Model ini muncul di pemilih model pengaturan sebagai opsi baru berlabel "Bidi (Terbaru)" di samping Standard Voice dan Advanced Voice Mode yang sudah ada, bukan menggantikannya.
gpt-bidi-1 di publik. Konteks persaingan: Dorongan suara bidirectional ini merespons langsung kemajuan dari Google (Gemini Live dengan interupsi), Anthropic, dan agen suara real-time dari startup. OpenAI berlomba untuk menyetarakan interaksi suara dengan kecerdasan teksnya, yang sudah mendukung penalaran setingkat GPT-5.5.
Studio Global AI
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
GPT Bidi 1 adalah model suara dua arah generasi terbaru dari OpenAI yang memungkinkan ChatGPT mendengar dan berbicara secara bersamaan, mampu menangani interupsi di tengah kalimat tanpa jeda atau error.
Loading comments...
Comments
0 comments