Mistral OCR 4, запущений 23–24 червня 2026 року, повертає не лише текст, а й координати абзаців (bounding boxes), типи блоків (заголовок, таблиця, рівняння, підпис) та показники впевненості для кожного слова. Модель очолює публічний рейтинг OlmOCRBench з показником 85,20 та набирає 93,07 на OmniDocBench, випереджаюч...

Create a landscape editorial hero image for this Studio Global article: Search & fact-check with cited sources for What are the key features, benchmark performance, pricing options, and strategic context of Mistr. Article summary: Here is the fact-checked breakdown of Mistral AI's newly released OCR 4 model.. Topic tags: general, documentation, general web, user generated. Style: premium digital editorial illustration, source-backed research mood, clean composition, high detail, modern web publication hero. Use reference image context only for broad subject, composition, and topical grounding; do not copy the exact image. Avoid: logos, brand marks, copyrighted characters, real person likenesses, fake screenshots, UI text, readable text, watermarks, charts with fake numbers, clickbait thumbnails, icons, and tiny thumbnail layouts. Make it useful as an illustrative visual, not as factual e
Mistral AI випустила OCR 4 23–24 червня 2026 року, здійснивши перехід від простого вилучення тексту до структурованого розуміння документів. Модель позиціонується як компонент для корпоративного пошуку, RAG-конвеєрів та агентних робочих процесів і з’явилася одночасно з Mistral Document AI та Mistral Medium 3.5 у Microsoft Azure AI Foundry .
Видобування з урахуванням структури. OCR 4 повертає межі абзаців (bounding boxes), мітки типів блоків (текст, заголовок, список, таблиця, зображення, рівняння, підпис, код, посилання, бічний текст, колонтитул, нижній колонтитул, підпис) та показники впевненості для кожного слова разом із вилученим текстом . Це робить вихідні дані безпосередньо придатними для відстеження цитат, редагування та семантичного розбиття без постобробки
.
Параметр API include_blocks. Увімкнувши його, кожна сторінка повертає масив blocks із структурними мітками та просторовими координатами в порядку читання .
170 мов у 10 мовних групах. Mistral повідомляє про особливе підвищення точності для рідкісних і менш поширених шрифтів, зокрема японської, гінді та грецької .
Локальне розгортання в одному контейнері. Модель можна повністю розгорнути локально в одному контейнері — ключова відмінність для регульованих галузей, які не можуть надсилати документи до зовнішніх API .
Мультимодальний ввід і структурований вивід. OCR 4 приймає PDF та зображення (документи Office через конвертацію) і видає структуровані Markdown та JSON, оптимізовані для інтеграції з RAG та агентними конвеєрами .
Mistral також повідомляє про високі результати на внутрішньому бенчмарку Crawl Multilingual, хоча конкретні числа не були опубліковані в переглянутих джерелах .
| Рівень | Ціна | Деталі |
|---|---|---|
| Стандартний OCR | $4 за 1000 сторінок | Базове вилучення тексту |
| Анотований (структурований) | $5 за 1000 сторінок | Включає bounding boxes, мітки блоків та показники впевненості |
Ціноутворення базується на кількості сторінок, а не токенів, що нетипово для інших моделей Mistral і відображає сценарій пакетної обробки документів.
OCR 4 знаменує свідомий перехід від «вилучення тексту» до «розуміння документів». Модель позиціонується як фундаментальний шар для корпоративного пошуку, RAG-конвеєрів та агентних робочих процесів, де критично важливо зберігати макет і структуру (таблиці, рівняння, підписи) . Вона безпосередньо конкурує з Google Document AI, Azure Document Intelligence та відкритими OCR-конвеєрами, поєднуючи структурований вивід за товарними цінами з можливістю локального розгортання в контейнері — рідкісне поєднання серед основних OCR API
.
Дизайн з одним контейнером є ключовою перевагою для фінансового, медичного та юридичного секторів, які потребують суверенітету даних . Mistral також зробила OCR 4 моделлю розуміння документів за замовчуванням для мільйонів користувачів Le Chat
.
Studio Global AI
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
Mistral OCR 4, запущений 23–24 червня 2026 року, повертає не лише текст, а й координати абзаців (bounding boxes), типи блоків (заголовок, таблиця, рівняння, підпис) та показники впевненості для кожного слова.
Mistral OCR 4, запущений 23–24 червня 2026 року, повертає не лише текст, а й координати абзаців (bounding boxes), типи блоків (заголовок, таблиця, рівняння, підпис) та показники впевненості для кожного слова. Модель очолює публічний рейтинг OlmOCRBench з показником 85,20 та набирає 93,07 на OmniDocBench, випереджаючи конкурентів.
Підтримує 170 мов у 10 групах, зокрема рідкісні та складні для OCR мови, як от японська, гінді та грецька.
Loading comments...
Comments
0 comments