| Model | Input ($/MTok) | Input Tersimpan ($/MTok) | Output ($/MTok) |
|---|---|---|---|
| Claude Opus 4.7/4.8 | $5,00 | $0,50 | $25,00 |
| Claude Sonnet 4.6 | $3,00 | $0,30 | $15,00 |
| Claude Haiku 4.5 | $1,00 | $0,10 | $5,00 |
| Model | Input ($/MTok) | Input Tersimpan ($/MTok) | Output ($/MTok) |
|---|---|---|---|
| codex-mini-latest | $1,50 | $0,375 | $6,00 |
| gpt-5.4-mini | $0,75 | $0,075 | $4,50 |
| gpt-5.1-codex-mini | $0,25 | $0,025 | $2,00 |
Untuk sesi standar yang menghabiskan 50.000 token input dan 10.000 token output, perhitungannya sangat kontras:
Model mini khusus koding milik OpenAI kira-kira 2–10 kali lebih murah ketimbang model sekelas Claude. Ini faktor krusial bagi pemakaian volume tinggi atau tim dengan dana terbatas .
Meski skor benchmark bisa naik-turun, pengalaman developer menunjukkan pola yang konsisten. Perbandingan langsung dari Juni 2026 memberikan panduan paling aplikatif .
Pemenang: Claude Code. Developer secara konsisten melaporkan Claude Code "lebih mampu mempertahankan konteks dalam sesi yang panjang dan sarat alat" . Saat Anda tenggelam dalam refaktorisasi berjam-jam di puluhan file, Claude cenderung lebih minim kehilangan alur kerja. Ini sesuai pengamatan komunitas bahwa ia "unggul dalam penalaran tugas tunggal yang rumit dan refaktorisasi"
.
Pemenang: OpenAI Codex. Perbandingan yang sama mencatat bahwa "delegasi cloud dan /review adalah fitur yang benar-benar saya andalkan sehari-hari" dengan Codex . Jika alur kerja Anda melibatkan pendelegasian pull request (PR) penuh ke agen untuk review awal atau membiarkannya mengeksekusi tugas terdefinisi baik secara mandiri di sandbox cloud, arsitektur Codex memang dibangun untuk itu.
Dengan model-model terbaru, muncul pilihan sulit:
Ini menunjukkan bahwa untuk banyak tugas pengembangan standar, selisih performa telah menyempit ke titik di mana penghematan besar-besaran dari model OpenAI kerap jadi pemenang.
gpt-5.1-codex-mini untuk koding rutin /review sebagai bagian dari alur kerja harian Kedua agen koding AI ini memang kian mirip dalam kapabilitas, namun kian menjauh dalam hal biaya dan arsitektur. Pilihan Anda bergantung pada prioritas: apakah penalaran mendalam yang persisten pada logika rumit, atau eksekusi cepat, murah, dan aman untuk tugas-tugas yang terdefinisi jelas.
Comments
0 comments