Seberapa Kuat GPT-5.5? Membaca Benchmark Publik dan Titik Lemahnya | Jawaban