JawabanDipublikasikan12 jam yang laluLast edited 11 jam yang lalu23 sumber

GPT-Bidi-1: Model Suara Dua Arah OpenAI yang Bikin ChatGPT Makin Mirip Obrolan Manusia

GPT Bidi 1 adalah model suara dua arah generasi terbaru dari OpenAI yang memungkinkan ChatGPT mendengar dan berbicara secara bersamaan, mampu menangani interupsi di tengah kalimat tanpa jeda atau error.

Cari dan periksa fakta dengan Studio Global AI Jelajahi lebih banyak halaman Trending

9.0K0

OpenAI's ChatGPT GPT-Bidi-1 bidirectional voice model concept illustration — Search & fact-check with cited sources for What is OpenAI's GPT-Bidi-1 bidirectional voice model for ChatGPT, including how it was discovereConceptual representation of OpenAI's next-generation bidirectional voice model, GPT-Bidi-1, for ChatGPT.
AI Perintah
Create a landscape editorial hero image for this Studio Global article: Search & fact-check with cited sources for What is OpenAI's GPT-Bidi-1 bidirectional voice model for ChatGPT, including how it was discovere. Article summary: OpenAI's **GPT-Bidi-1** is a next-generation bidirectional voice model for ChatGPT, discovered via code and UI references in the ChatGPT web and mobile apps. It represents the largest voice-mode upgrade ever for ChatGPT,. Topic tags: general, general web, user generated. Style: premium digital editorial illustration, source-backed research mood, clean composition, high detail, modern web publication hero. Use reference image context only for broad subject, composition, and topical grounding; do not copy the exact image. Avoid: logos, brand marks, copyrighted characters, real person likenesses, fake screenshots, UI text, readable text, watermarks, charts with fa
openai.com

OpenAI sedang mempersiapkan upgrade suara terbesar untuk ChatGPT: model audio dua arah (bidirectional) yang diberi kode nama GPT-Bidi-1. Berbeda dengan mode suara ChatGPT sebelumnya yang hanya bisa merespons setelah pengguna selesai bicara, GPT-Bidi-1 bisa mendengar dan berbicara secara bersamaan — mampu menyerap interupsi, mengoreksi kesalahan secara real-time, dan menyesuaikan jawaban tanpa memutus alur audio.

Artikel ini membahas bagaimana GPT-Bidi-1 ditemukan, apa yang membedakannya dari model suara bergiliran sebelumnya, tiga tingkat kecerdasan yang diperkenalkan, perubahan visual pada antarmuka ChatGPT, serta konteks persaingan pengembangannya. Perlu dicatat: model ini belum diumumkan secara resmi oleh OpenAI. Seluruh informasi berasal dari kode yang bocor, referensi antarmuka, laporan pengguna, dan analisis media.

Bagaimana GPT-Bidi-1 Ditemukan

Rantai penemuan dimulai dari developer M1Astra, yang pertama kali melihat referensi gpt-bidi-1 dalam kode aplikasi ChatGPT dan membagikannya di platform X. Situs pelacak TestingCatalog kemudian mengonfirmasi string model tersebut, lengkap dengan teks pengumuman yang menyebut "generasi berikutnya dari Voice" dan "lompatan besar dalam kecerdasan."

Elemen kode dan antarmuka kemudian ditemukan di klien web dan mobile ChatGPT. Uji coba terbatas mulai mengalir ke sekelompok kecil pengguna pada akhir Juni 2026. Pada 22–24 Juni 2026, muncul laporan dari pengguna dan video demonstrasi yang menunjukkan model ini bekerja secara dua arah.

Catatan: OpenAI belum mengeluarkan pengumuman resmi. Nama akhir model, perilaku tingkat kecerdasan, dan tanggal peluncuran masih belum dikonfirmasi oleh perusahaan.

Apa Bedanya dengan Model Suara Bergiliran?

Mode suara ChatGPT saat ini — Standard Voice dan Advanced Voice Mode — beroperasi secara bergiliran. Model harus menunggu pengguna selesai bicara sebelum bisa merespons. Arsitektur bidirectional (BiDi) dari GPT-Bidi-1 memungkinkan model memproses dua aliran audio secara simultan: suara Anda dan suaranya sendiri.

Perbedaan perilaku utama yang terlihat dalam demonstrasi:

Penanganan interupsi: Model bisa menyerap interupsi di tengah kalimat dan menyesuaikan respons secara dinamis tanpa membeku atau memutus alur audio.
Koreksi real-time: Dalam pengujian, GPT-Bidi-1 menghitung bersama pengguna dari 1 hingga 10, lalu langsung beralih menghitung mundur saat pengguna menyela di tengah aliran.
Tumpang tindih alami: Asisten bisa berbicara saat pengguna masih bicara, membuat percakapan lebih mirip obrolan manusia.

Tujuan internal OpenAI adalah menutup kesenjangan antara tumpukan suara ChatGPT — yang tertinggal dari model teksnya (sudah mencapai penalaran setara GPT-5.5) — dan memberikan kesetaraan dalam kecerdasan percakapan real-time.

Tiga Tingkat Kecerdasan yang Bisa Dipilih

GPT-Bidi-1 adalah model suara OpenAI pertama yang memperkenalkan tiga tingkat kecerdasan dan kecepatan yang bisa dipilih untuk suara:

Tingkat	Deskripsi
High (Tinggi)	Kedalaman penalaran maksimal, respons lebih lambat — untuk tugas analisis kompleks
Medium (Sedang)	Keseimbangan antara kecerdasan dan kecepatan
Instant (Instan)	Respons tercepat, penalaran dikurangi — untuk interaksi santai atau yang sensitif terhadap waktu

Sistem tingkat ini memungkinkan pengguna menyesuaikan kedalaman interaksi versus latensi per tugas, mirip dengan model teks ChatGPT yang menawarkan tingkat penalaran berbeda. Misalnya, query cuaca cepat bisa menggunakan Instant, sementara sesi brainstorming mendalam beralih ke High.

Perubahan Visual pada Antarmuka Suara

Saat GPT-Bidi-1 dipilih, indikator gelembung/gelombang suara berubah menjadi kuning dari warna default saat ini. Model ini muncul di pemilih model pengaturan sebagai opsi baru berlabel "Bidi (Terbaru)" di samping Standard Voice dan Advanced Voice Mode yang sudah ada, bukan menggantikannya.

Linimasa Pengembangan dan Konteks Persaingan

Awal 2026: OpenAI mulai mengembangkan arsitektur BiDi secara internal.
5 Maret 2026: The Information melaporkan bahwa OpenAI sedang mengembangkan model audio dua arah untuk meningkatkan asisten suaranya.
7 Mei 2026: OpenAI mengumumkan GPT-Realtime-2 di API — model suara pertamanya dengan penalaran setara GPT-5, yang menjadi dasar kemampuan bidirectional.
16–17 Juni 2026: M1Astra dan TestingCatalog pertama kali melihat referensi kode untuk gpt-bidi-1 di publik.
22–24 Juni 2026: Laporan pengguna dan video demonstrasi muncul, menunjukkan perilaku bidirectional yang berfungsi. Beberapa media melaporkan bahwa peluncuran yang lebih luas mungkin terjadi dalam minggu yang sama.

Konteks persaingan: Dorongan suara bidirectional ini merespons langsung kemajuan dari Google (Gemini Live dengan interupsi), Anthropic, dan agen suara real-time dari startup. OpenAI berlomba untuk menyetarakan interaksi suara dengan kecerdasan teksnya, yang sudah mendukung penalaran setingkat GPT-5.5.

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Cari dan periksa fakta dengan Studio Global AI

Orang-orang juga bertanya

Apa jawaban singkat untuk "GPT-Bidi-1: Model Suara Dua Arah OpenAI yang Bikin ChatGPT Makin Mirip Obrolan Manusia"?

Sumber

Comments

0 comments

Loading comments...

← Back to Trending