include_blocksblocks170 bahasa dalam 10 kelompok bahasa. Mistral melaporkan peningkatan akurasi yang signifikan pada aksara yang lebih jarang dan kurang didukung, termasuk Jepang, Hindi, dan Yunani .
Hosting mandiri dalam satu kontainer. Model ini dapat dijalankan sepenuhnya di server sendiri dalam satu kontainer, menjadi pembeda utama bagi industri yang diatur regulator yang tidak bisa mengirim dokumen ke API eksternal .
Input multimodal dan output terstruktur. OCR 4 menerima PDF dan gambar (dokumen Office melalui konversi) dan menghasilkan output Markdown dan JSON terstruktur, dirancang untuk integrasi dengan pipeline RAG dan agen .
Mistral juga melaporkan skor kuat pada benchmark internal Crawl Multilingual, meskipun angka pastinya tidak dipublikasikan di sumber yang ditinjau .
| Tingkat | Harga | Detail |
|---|---|---|
| OCR Standar | $4 per 1.000 halaman | Ekstraksi teks dasar |
| Anotasi (terstruktur) | $5 per 1.000 halaman | Termasuk bounding box, label blok, dan skor kepercayaan |
Harga berbasis halaman, bukan token, yang tidak biasa di antara model Mistral lainnya dan mencerminkan kasus penggunaan dokumen dalam jumlah besar.
OCR 4 menandai pergeseran yang disengaja dari "ekstraksi teks" ke "pemahaman dokumen." Model ini diposisikan sebagai lapisan fundamental untuk pencarian perusahaan, pipeline RAG, dan alur kerja agen di mana mempertahankan tata letak dan struktur (tabel, persamaan, tanda tangan) sangat penting . Ini secara langsung menargetkan Google Document AI, Azure Document Intelligence, dan pipeline OCR open-source dengan menggabungkan output terstruktur dengan harga komoditas dan opsi kontainer yang dapat dihosting sendiri—kombinasi yang langka di antara API OCR utama
.
Comments
0 comments