include_blocks-parameter i API-et. Når denne er aktivert, returnerer hver side en blocks-liste med strukturelle etiketter og romlige koordinater i leserekkefølge .
170 språk fordelt på 10 språkgrupper. Mistral rapporterer særlig fremgang på sjeldnere og mindre utbredte skriftspråk, inkludert japansk, hindi og gresk .
Selvhosting i én container. Modellen kan kjøres fullstendig på egne servere i én enkelt container – en nøkkelfunksjon for regulerte bransjer som ikke kan sende dokumenter til eksterne API-er .
Multimodal inndata og strukturert utdata. OCR 4 tar imot PDF-er og bilder (Office-dokumenter via konvertering) og leverer strukturert Markdown og JSON, designet for integrasjon med RAG- og agentiske pipelines .
Mistral rapporterer også gode resultater på sin interne Crawl Multilingual-test, men rådataene er ikke offentliggjort .
| Nivå | Pris | Detaljer |
|---|---|---|
| Standard OCR | ca. 35 kr per 1 000 sider ($4) | Grunnleggende teksteksrahering |
| Annotert (strukturert) | ca. 44 kr per 1 000 sider ($5) | Inkluderer koordinater, blokketiketter og konfidensskårer |
Prisen er per side, ikke per token, noe som er uvanlig for Mistrals øvrige modeller og gjenspeiler bruksområdet som dokumentbehandling i batcher.
OCR 4 er et bevisst skifte fra «teksteksrahering» til «dokumentforståelse». Modellen er posisjonert som et grunnlag for bedriftssøk, RAG-pipelines og agentiske arbeidsflyter der det er kritisk å bevare layout og struktur (tabeller, ligninger, signaturer) . Den utfordrer direkte Google Document AI, Azure Document Intelligence og åpne OCR-pipelines ved å kombinere strukturert utdata, fordelaktig pris og en selvhostbar container – en sjelden kombinasjon blant større OCR-API-er
.
Comments
0 comments