Mistral OCR 4, lanceret 23.–24. juni 2026, returnerer afsnitsnøjagtige afgrænsningsbokse, typede bloketiketter (titel, tabel, ligning, signatur) og tillidsscorer på ordniveau – understøtter 170 sprog.

Create a landscape editorial hero image for this Studio Global article: Search & fact-check with cited sources for What are the key features, benchmark performance, pricing options, and strategic context of Mistr. Article summary: Here is the fact-checked breakdown of Mistral AI's newly released OCR 4 model.. Topic tags: general, documentation, general web, user generated. Style: premium digital editorial illustration, source-backed research mood, clean composition, high detail, modern web publication hero. Use reference image context only for broad subject, composition, and topical grounding; do not copy the exact image. Avoid: logos, brand marks, copyrighted characters, real person likenesses, fake screenshots, UI text, readable text, watermarks, charts with fake numbers, clickbait thumbnails, icons, and tiny thumbnail layouts. Make it useful as an illustrative visual, not as factual e
Mistral AI udgav OCR 4 den 23.–24. juni 2026 og markerede et skift fra ren tekstudtræk til struktureret dokumentforståelse. Modellen er designet som en indtagskomponent til virksomhedssøgning, RAG-pipelines og agentiske arbejdsgange, og den lanceres samtidig med Mistral Document AI og Mistral Medium 3.5 i Microsoft Azure AI Foundry .
Strukturbevidst udtrækning. OCR 4 returnerer afsnits-nøjagtige afgrænsningsbokse, bloktype-etiketter (tekst, titel, liste, tabel, billede, ligning, billedtekst, kode, referencer, sidetekst, header, footer, signatur) samt tillidsscorer på ordniveau ved siden af den udtrukne tekst . Dette gør output direkte anvendeligt til citationssporing, redigering og semantisk opdeling uden efterbehandling
.
include_blocks API-parameter. Når den aktiveres, returnerer hver side en blocks-matrix med strukturelle etiketter og rumlige koordinater i læserækkefølge .
170 sprog på tværs af 10 sproggrupper. Mistral rapporterer særlige præcisionsforbedringer på sjældnere og mindre ressourcestærke skriftsprog, herunder japansk, hindi og græsk .
Selvhost i én container. Modellen kan implementeres fuldstændigt on-premises i én enkelt container – en vigtig differentieringsfaktor for regulerede brancher, der ikke kan sende dokumenter til eksterne API'er .
Multimodal input og struktureret output. OCR 4 accepterer PDF'er og billeder (Office-dokumenter via konvertering) og leverer struktureret Markdown og JSON, optimeret til integration med RAG- og agentiske pipelines .
Mistral rapporterer også stærke resultater på deres interne Crawl Multilingual-benchmark, men de rå tal blev ikke offentliggjort i de gennemgåede kilder .
| Niveau | Pris | Detaljer |
|---|---|---|
| Standard OCR | 4 dollars per 1.000 sider | Grundlæggende tekstudtrækning |
| Annoteret (struktureret) | 5 dollars per 1.000 sider | Inkluderer afgrænsningsbokse, bloketiketter og tillidsscorer |
Priserne er sidebaserede, ikke token-baserede, hvilket er usædvanligt blandt Mistrals andre modeller og afspejler dokument-batch-anvendelsestilfældet.
OCR 4 markerer et bevidst skift fra ”tekstudtrækning” til ”dokumentforståelse.” Det positioneres som et grundlæggende lag til virksomhedssøgning, RAG-pipelines og agentiske arbejdsgange, hvor det er afgørende at bevare layout og struktur (tabeller, ligninger, signaturer) . Det retter sig direkte mod Googles Document AI, Azure Document Intelligence og open source-OCR-pipelines ved at kombinere struktureret output til råvarepriser med en selvhostbar containermulighed – en sjælden kombination blandt store OCR-API'er
.
Designet med én container er en vigtig differentieringsfaktor for finans-, sundheds- og legalbrancher, der kræver datasuverænitet . Mistral har også gjort OCR 4 til standardmodellen for dokumentforståelse på tværs af millioner af brugere på Le Chat
.
Studio Global AI
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
Mistral OCR 4, lanceret 23.–24. juni 2026, returnerer afsnitsnøjagtige afgrænsningsbokse, typede bloketiketter (titel, tabel, ligning, signatur) og tillidsscorer på ordniveau – understøtter 170 sprog.
Mistral OCR 4, lanceret 23.–24. juni 2026, returnerer afsnitsnøjagtige afgrænsningsbokse, typede bloketiketter (titel, tabel, ligning, signatur) og tillidsscorer på ordniveau – understøtter 170 sprog. Modellen topper den offentlige OlmOCRBench ledertavle med 85,20 og scorer 93,07 på OmniDocBench.
Loading comments...
Comments
0 comments