Mistral OCR 4, julkaistu 23.–24. kesäkuuta 2026, palauttaa tekstin lisäksi kappalerajat, lohkotyypit (otsikko, taulukko, kaava, allekirjoitus) ja luottamusluvut, tukee 170 kieltä ja on asennettavissa yhteen konttiin.

Create a landscape editorial hero image for this Studio Global article: Search & fact-check with cited sources for What are the key features, benchmark performance, pricing options, and strategic context of Mistr. Article summary: Here is the fact-checked breakdown of Mistral AI's newly released OCR 4 model.. Topic tags: general, documentation, general web, user generated. Style: premium digital editorial illustration, source-backed research mood, clean composition, high detail, modern web publication hero. Use reference image context only for broad subject, composition, and topical grounding; do not copy the exact image. Avoid: logos, brand marks, copyrighted characters, real person likenesses, fake screenshots, UI text, readable text, watermarks, charts with fake numbers, clickbait thumbnails, icons, and tiny thumbnail layouts. Make it useful as an illustrative visual, not as factual e
Mistral AI julkaisi OCR 4 -mallin 23.–24. kesäkuuta 2026. Kyse ei ole enää pelkästä tekstintunnistuksesta vaan dokumenttien rakenteellisesta ymmärtämisestä. Malli on suunniteltu yritysten hakuratkaisujen, RAG-järjestelmien ja agenttityönkulkujen perustaksi, ja se on saatavilla yhdessä Mistral Document AI:n ja Mistral Medium 3.5:n kanssa Microsoft Azure AI Foundryssa .
Rakennetietoinen tekstintunnistus. OCR 4 palauttaa kappaletasoiset reunukset, lohkotyypit (teksti, otsikko, lista, taulukko, kuva, kaava, kuvateksti, koodi, viittaukset, reunahuomautus, ylätunniste, alatunniste, allekirjoitus) sekä sanakohtaiset luottamusluvut tekstin ohella . Tämä tekee tulosteesta suoraan käyttökelpoista viittauksia, sensuuria ja semanttista paloittelua varten ilman jälkikäsittelyä
.
include_blocks-API-parametri. Kun parametri on käytössä, jokainen sivu palauttaa blocks-taulukon, jossa on rakenteelliset tunnisteet ja sijaintitiedot lukujärjestyksessä .
170 kieltä 10 kieliryhmässä. Mistral raportoi erityisen suurta tarkkuutta harvinaisemmilla ja vähäisillä kirjoitusjärjestelmillä, kuten japani, hindi ja kreikka .
Yhden kontin asennus. Malli voidaan asentaa kokonaan omille palvelimille yhteen konttiin, mikä on tärkeä etu säännellyillä toimialoilla, jotka eivät voi lähettää dokumentteja ulkoisiin API-rajapintoihin .
Monimuotoinen syöte ja rakenteellinen tulos. OCR 4 ottaa vastaan PDF-tiedostoja ja kuvia (Office-dokumentit muunnoksen kautta) ja tuottaa rakenteellista Markdownia ja JSONia, jotka on suunniteltu integroitavaksi RAG- ja agenttityönkulkuihin .
Mistral raportoi myös vahvoja tuloksia omassa Crawl Multilingual -vertailussaan, mutta tarkkoja lukuja ei julkaistu lähteissä .
| Taso | Hinta | Tarkemmat tiedot |
|---|---|---|
| Perus OCR | 4 dollaria / 1000 sivua | Perustason tekstintunnistus |
| Rakenteellinen | 5 dollaria / 1000 sivua | Sisältää reunukset, lohkotyypit ja luottamusluvut |
Hinnoittelu perustuu sivuihin, ei merkkimääriin, mikä on epätavallista Mistralin muihin malleihin verrattuna ja heijastaa dokumenttierien käyttötarkoitusta.
OCR 4 merkitsee tietoista siirtymää "tekstintunnistuksesta" "dokumenttien ymmärtämiseen". Malli on suunniteltu yrityshallinnon, RAG-järjestelmien ja agenttityönkulkujen perustaksi, joissa layoutin ja rakenteen (taulukot, kaavat, allekirjoitukset) säilyttäminen on kriittistä . Se haastaa suoraan Googlen Document AI:n, Azuren Document Intelligencen ja avoimen lähdekoodin OCR-putket yhdistämällä rakenteellisen tulostuksen, edullisen hinnoittelun ja itse isännöitävän kontin – harvinainen yhdistelmä suurten OCR-APIen joukossa
.
Yksikonttinen rakenne on keskeinen erottava tekijä rahoitus-, terveydenhuolto- ja lakialoilla, jotka vaativat tietosuvereniteettia . Mistral on myös tehnyt OCR 4:stä oletusarvoisen dokumenttien ymmärrystä käsittelevän mallin miljoonille Le Chat -palvelun käyttäjille
.
Studio Global AI
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
Mistral OCR 4, julkaistu 23.–24. kesäkuuta 2026, palauttaa tekstin lisäksi kappalerajat, lohkotyypit (otsikko, taulukko, kaava, allekirjoitus) ja luottamusluvut, tukee 170 kieltä ja on asennettavissa yhteen konttiin.
Mistral OCR 4, julkaistu 23.–24. kesäkuuta 2026, palauttaa tekstin lisäksi kappalerajat, lohkotyypit (otsikko, taulukko, kaava, allekirjoitus) ja luottamusluvut, tukee 170 kieltä ja on asennettavissa yhteen konttiin. Se saavutti 85.20 pistettä julkisella OlmOCRBench vertailulistalla ja 93.07 pistettä OmniDocBench vertailussa.
Hinnoittelu on 4 dollaria per 1000 sivua (perustaso) ja 5 dollaria per 1000 sivua (rakenteellinen).
Loading comments...
Comments
0 comments