Interpretasinya cukup menarik:
Kesimpulannya: Composer 2.5 belum tentu mengungguli semua model frontier, tetapi sudah berada di level kompetitif untuk banyak tugas software engineering.
Salah satu hal paling menonjol dari rilis ini adalah strategi harga.
Harga Composer 2.5 sekitar:
Cursor juga menyediakan varian lebih cepat dengan harga:
Sebagai perbandingan, beberapa laporan memperkirakan model Claude Opus memiliki biaya sekitar $5 per juta input token dan $25 per juta output token.
Perbedaan harga ini sangat penting karena agen coding mengonsumsi token dalam jumlah besar. Satu tugas pengembangan perangkat lunak bisa melibatkan:
Setiap langkah biasanya memicu panggilan model tambahan. Dengan harga token lebih rendah, Cursor dapat menjalankan lebih banyak langkah reasoning tanpa biaya yang melonjak.
Composer 2.5 dibangun di atas checkpoint open‑weight Kimi K2.5 dari Moonshot AI, yang kemudian diperluas dengan pelatihan tambahan khusus untuk tugas rekayasa perangkat lunak.
Laporan mengenai proses pelatihannya menyebutkan beberapa hal penting:
Tugas sintetis ini mensimulasikan workflow pengembangan nyata—misalnya merencanakan perubahan kode, mengedit file, menjalankan tes, dan mengulang sampai berhasil. Pendekatan tersebut membantu meningkatkan reliabilitas model saat menghadapi masalah engineering nyata.
Rilis Composer 2.5 juga menunjukkan perubahan strategi penting bagi Cursor.
Pada awalnya, banyak fitur AI di Cursor bergantung pada model eksternal seperti OpenAI, Anthropic, dan Google. Mengembangkan model sendiri memberi beberapa keuntungan strategis.
Beberapa di antaranya:
Ini menjadi semakin penting karena pesaing seperti Claude Code dari Anthropic memiliki integrasi erat antara model AI dan alat coding mereka.
Dengan mengembangkan seri model Composer, Cursor berusaha bersaing langsung dalam kategori baru: platform pengembang yang menggabungkan model AI + alat coding dalam satu ekosistem.
Composer 2.5 belum mendominasi semua benchmark—GPT‑5.5 masih unggul di beberapa evaluasi agen, dan Claude Opus 4.7 tetap sangat kompetitif.
Namun kombinasi antara performa coding yang mendekati model frontier dan harga token yang jauh lebih rendah membuatnya menarik bagi developer.
Jika Cursor terus meningkatkan model internalnya sambil mempertahankan keunggulan biaya ini, mereka berpotensi mengubah ekonomi penggunaan agen coding AI di dalam IDE.
Comments
0 comments