Mistral OCR 4, 23 24 Haziran 2026'da piyasaya sürüldü; PDF ve görsellerden yalnızca metin değil, paragraf düzeyinde sınır kutuları, blok türü etiketleri (başlık, tablo, denklem, imza vb.) ve her kelime için güven skor... OlmOCRBench liderlik tablosunda 85.20 puanla birinci olurken, OmniDocBench'te 93.07 puan aldı.

Create a landscape editorial hero image for this Studio Global article: Search & fact-check with cited sources for What are the key features, benchmark performance, pricing options, and strategic context of Mistr. Article summary: Here is the fact-checked breakdown of Mistral AI's newly released OCR 4 model.. Topic tags: general, documentation, general web, user generated. Style: premium digital editorial illustration, source-backed research mood, clean composition, high detail, modern web publication hero. Use reference image context only for broad subject, composition, and topical grounding; do not copy the exact image. Avoid: logos, brand marks, copyrighted characters, real person likenesses, fake screenshots, UI text, readable text, watermarks, charts with fake numbers, clickbait thumbnails, icons, and tiny thumbnail layouts. Make it useful as an illustrative visual, not as factual e
Mistral AI, 23–24 Haziran 2026'da OCR 4'ü piyasaya sürerek belge işlemede düz metin çıkarmadan yapılandırılmış belge anlamaya geçiş yaptı. Model, kurumsal arama, RAG (Getirmeyle Zenginleştirilmiş Üretim) ve ajan tabanlı iş akışları için bir besleme bileşeni olarak tasarlandı ve Mistral Document AI ile Mistral Medium 3.5 ile birlikte Microsoft Azure AI Foundry'de kullanıma sunuldu .
Yapı bilincine sahip çıkarım. OCR 4, çıkarılan metnin yanı sıra paragraf düzeyinde sınır kutuları, blok türü etiketleri (metin, başlık, liste, tablo, resim, denklem, altyazı, kod, referanslar, kenar metni, başlık, altbilgi, imza) ve her kelime için güven skorları döndürüyor . Bu sayede çıktılar, sonradan işleme gerek kalmadan doğrudan alıntı takibi, düzeltme ve anlamsal parçalama için kullanılabiliyor
.
include_blocks API parametresi. Etkinleştirildiğinde, her sayfa okuma sırasına göre yapısal etiketler ve uzamsal koordinatlar içeren bir blocks dizisi döndürüyor .
10 dil grubunda 170 dil. Mistral, özellikle Japonca, Hintçe ve Yunanca gibi daha az yaygın ve düşük kaynaklı dillerde belirgin doğruluk artışları bildiriyor .
Tek konteynırda şirket içi barındırma. Model, tamamen şirket içinde tek bir konteynırda dağıtılabiliyor. Bu, belgelerini harici API'lere gönderemeyen regüle sektörler için önemli bir farklılaştırıcı .
Çok modlu girdi ve yapılandırılmış çıktı. OCR 4, PDF'leri ve görselleri kabul ediyor (Office belgeleri dönüştürme yoluyla) ve yapılandırılmış Markdown ve JSON çıktısı veriyor; RAG ve ajan tabanlı iş akışlarına entegrasyon için optimize edilmiş .
Mistral ayrıca dahili Crawl Multilingual kıyaslamasında da güçlü skorlar bildiriyor, ancak incelenen kaynaklarda ham sayılar yayınlanmadı .
| Kademe | Fiyat | Detaylar |
|---|---|---|
| Standart OCR | 1.000 sayfa başına $4 | Temel metin çıkarma |
| Açıklamalı (yapılandırılmış) | 1.000 sayfa başına $5 | Sınır kutuları, blok etiketleri ve güven skorlarını içerir |
Fiyatlandırma token bazlı değil, sayfa bazındadır. Bu, Mistral'ın diğer modelleri arasında alışılmadık bir durumdur ve belge yığını kullanım senaryosunu yansıtır.
OCR 4, bilinçli bir şekilde "metin çıkarma"dan "belge anlamaya" geçişi işaret ediyor. Kurumsal arama, RAG iş akışları ve düzen ile yapının (tablolar, denklemler, imzalar) korunmasının kritik olduğu ajan tabanlı iş akışları için temel bir katman olarak konumlandırılıyor . Doğrudan Google'ın Document AI'sini, Azure Document Intelligence'ı ve açık kaynaklı OCR iş akışlarını hedef alıyor; yapılandırılmış çıktıyı emtia fiyatlandırmasıyla ve kendi kendine barındırılabilir bir konteynır seçeneğiyle birleştiriyor; bu, büyük OCR API'leri arasında nadir görülen bir kombinasyon
.
Tek konteynır tasarımı, veri egemenliği gerektiren finans, sağlık ve hukuk sektörleri için kilit bir farklılaştırıcı . Mistral ayrıca OCR 4'ü Le Chat'teki milyonlarca kullanıcı için varsayılan belge anlama modeli haline getirdi
.
Studio Global AI
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
Mistral OCR 4, 23 24 Haziran 2026'da piyasaya sürüldü; PDF ve görsellerden yalnızca metin değil, paragraf düzeyinde sınır kutuları, blok türü etiketleri (başlık, tablo, denklem, imza vb.) ve her kelime için güven skor...
Mistral OCR 4, 23 24 Haziran 2026'da piyasaya sürüldü; PDF ve görsellerden yalnızca metin değil, paragraf düzeyinde sınır kutuları, blok türü etiketleri (başlık, tablo, denklem, imza vb.) ve her kelime için güven skor... OlmOCRBench liderlik tablosunda 85.20 puanla birinci olurken, OmniDocBench'te 93.07 puan aldı.
Fiyatlandırma sayfa bazında: Standart OCR 1.000 sayfa başına $4, yapılandırılmış (açıklamalı) çıktı $5.
Loading comments...
Comments
0 comments