Model ini juga mencapai skor 81,2 pada tes matematika AIME 2025, naik dari 65,4 untuk GPT-5.3 Instant, dan skor 76 pada tolok ukur penalaran multimodal MMMU-Pro, naik dari 69,2 .
OpenAI merilis versi baru GPT-5.5 Instant yang bertujuan membuat jawaban lebih pendek, tidak terlalu sarat poin, dan lebih natural . Michelle Pokras, pimpinan riset OpenAI, menggambarkan model sebelumnya sebagai "terlalu kecanduan poin-poin" dan mengatakan versi baru ini meningkatkan "sikap menjilat, faktualitas, dan performa multibahasa"
.
Catatan rilis OpenAI menyatakan bahwa pembaruan ini membuat GPT-5.5 Instant "lebih mudah dibaca, lebih natural dalam percakapan sehari-hari, dan lebih baik dalam memberikan bantuan praktis, dengan respons yang tidak terlalu panjang atau sarat poin" .
Canvas pensiun untuk GPT-5.5 Instant dan GPT-5.5 Thinking. Tugas menulis dan membuat kode yang sebelumnya menggunakan panel samping Canvas kini muncul sebagai blok tulis dan blok kode inline dalam utas chat . Pengguna berbayar tetap dapat mengakses Canvas melalui model lama selama masa transisi
.
Dokumentasi OpenAI sendiri mengonfirmasi bahwa pengguna Plus dapat mengirim maksimal 160 pesan GPT-5.5 setiap 3 jam, setelah itu "sistem akan diam-diam beralih ke model mini hingga kuota diatur ulang" — sebuah kebijakan yang mungkin menjelaskan beberapa ketidakkonsistenan yang dirasakan.
Snapshot 24 Juni menonjol karena apa yang tidak dimilikinya: tidak ada detail perilaku, tidak ada catatan fitur, dan tidak ada perbandingan kinerja. Changelog hanya satu baris . Ini konsisten dengan praktik OpenAI yang memperlakukan
chat-latest sebagai target bergulir untuk pengujian, tetapi membuat pengguna dan pengembang tanpa ekspektasi yang jelas tentang apa yang berubah.
Klaim bahwa pembaruan 24 Juni secara khusus meningkatkan pemahaman maksud pengguna, penanganan kendala kompleks, atau rekomendasi belanja dan lokal tidak dapat dikonfirmasi dari sumber yang tersedia . Kemampuan ini adalah bagian dari ekosistem GPT-5.5 yang lebih luas — peluncuran andalan GPT-5.5 pada 23 April menekankan "memahami apa yang ingin Anda lakukan lebih cepat"
, dan catatan rilis ChatGPT Maret 2026 memperkenalkan pengalaman riset belanja interaktif
— tetapi keduanya tidak terkait dengan snapshot 24 Juni.
Sejak peluncurannya pada 5 Mei, GPT-5.5 Instant telah mengalami peningkatan berarti dalam akurasi faktual, keringkasan respons, dan nada percakapan. Snapshot 24 Juni melanjutkan pola pembaruan rutin tetapi tidak memiliki dokumentasi untuk memverifikasi perubahan perilaku spesifik. Pengguna yang mengalami ketidakkonsistenan mungkin menemui kebijakan pengalihan model mini diam-diam, bukan penurunan kualitas model. Bagi pengembang yang mengandalkan chat-latest di produksi, kurangnya detail changelog berarti menguji setiap snapshot terhadap kasus penggunaan Anda tetap penting.
Comments
0 comments