include_blocks-parameter i API:et. När den är aktiverad returnerar varje sida en blocks-array med strukturella etiketter och rumsliga koordinater i läsordning .
170 språk i tio språkgrupper. Mistral rapporterar särskilda förbättringar för ovanligare och mindre resursstarka skriftspråk – inklusive japanska, hindi och grekiska .
Egen drift i en enda container. Modellen kan installeras helt lokalt i en enda container – en avgörande fördel för reglerade branscher som inte kan skicka dokument till externa API:er .
Multimodal inmatning och strukturerad utdata. OCR 4 tar emot PDF:er och bilder (Office-dokument via konvertering) och levererar strukturerad Markdown och JSON – optimerat för integration i RAG- och agentbaserade pipelines .
Mistral rapporterar också starka resultat på sitt interna Crawl Multilingual-benchmark, även om exakta siffror inte publicerades i de källor som gåtts igenom .
| Nivå | Pris | Detaljer |
|---|---|---|
| Standard OCR | 4 USD per 1 000 sidor | Grundläggande textutvinning |
| Annoterad (strukturerad) | 5 USD per 1 000 sidor | Inkluderar position, blocketiketter och konfidenspoäng |
Priserna är sidbaserade, inte tokenbaserade – ovanligt bland Mistrals modeller och en återspegling av användningsområdet med dokument i batch.
OCR 4 markerar en medveten förflyttning från "textutvinning" till "dokumentförståelse". Modellen placeras som ett grundläggande lager för företags sökning, RAG-system och autonoma arbetsflöden där det är avgörande att bevara layout och struktur – som tabeller, ekvationer och signaturer . Den konkurrerar direkt med Googles Document AI, Azure Document Intelligence och öppen källkodsbaserade OCR-verktyg – genom att kombinera strukturerad utdata till lågt pris med möjligheten till egen drift
.
Den containerbaserade lösningen är en särskiljande faktor för finans-, sjukvårds- och juridiksektorn, som kräver full kontroll över data . Mistral har också gjort OCR 4 till standardmodell för dokumentförståelse för miljontals användare på Le Chat
.
Comments
0 comments