Parametr API include_blocks. Pokud je zapnutý, každá stránka vrací pole blocks se strukturními štítky a prostorovými souřadnicemi v pořadí, v jakém se dokument čte .
170 jazyků v 10 jazykových skupinách. Mistral uvádí výrazné zlepšení přesnosti u méně obvyklých a málo podporovaných písem, zejména japonštiny, hindštiny a řečtiny .
Samostatný kontejner pro lokální provoz. Model lze nasadit zcela na vlastní infrastruktuře v jednom kontejneru. To je klíčový rozdíl oproti konkurenci pro regulovaná odvětví, která nemohou posílat dokumenty na externí API .
Multimodální vstup a strukturovaný výstup. OCR 4 přijímá PDF a obrázky (kancelářské dokumenty po konverzi) a vrací strukturovaný Markdown a JSON, připravený pro integraci s RAG a agentickými pipeline .
Mistral také uvádí silné výsledky na svém interním benchmarku Crawl Multilingual; konkrétní čísla však v recenzovaných zdrojích nebyla zveřejněna .
| Úroveň | Cena | Podrobnosti |
|---|---|---|
| Základní OCR | 4 USD za 1 000 stran | Základní extrakce textu |
| Anotované (strukturované) | 5 USD za 1 000 stran | Včetně bounding boxů, štítků bloků a skóre spolehlivosti |
Ceny jsou stanoveny na stránku, nikoliv na token, což je u modelů Mistral neobvyklé a odráží to hromadné zpracování dokumentů.
OCR 4 představuje záměrný posun od "extrakce textu" k "porozumění dokumentu." Je postaven jako základní vrstva pro firemní vyhledávání, RAG pipeline a agentické workflow, kde je klíčové zachovat rozvržení a strukturu (tabulky, rovnice, podpisy) . Model přímo konkuruje Google Document AI, Azure Document Intelligence a open-source OCR řešením – kombinuje strukturovaný výstup za přijatelnou cenu s možností lokálního nasazení, což je mezi velkými OCR API jen výjimečná kombinace
.
Comments
0 comments