O Mistral OCR 4 extrai texto com bounding boxes (caixas delimitadoras) por parágrafo, rótulos de bloco (título, tabela, equação, assinatura etc.) e pontuação de confiança por palavra [1][7][1]. Com o parâmetro 'include blocks', cada página retorna um array de blocos com coordenadas espaciais e rótulos estruturais [1].

Create a landscape editorial hero image for this Studio Global article: Search & fact check with cited sources for What are the key features, benchmark performance, pricing options, and strategic context of Mistr. Article summary: Here is the fact checked breakdown of Mistral AI's newly released OCR 4 model.. Topic tags: general web, llm, agents, ai, automation. Style: premium digital editorial illustration, source-backed research mood, clean composition, high detail, modern web publication hero. Use reference image context only for broad subject, composition, and topical grounding; do not copy the exact image. Avoid: logos, brand marks, copyrighted characters, real person likenesses, fake screenshots, UI text, readable text, watermarks, charts with fake numbers, clickbait thumbnails, icons, and tiny thumbnail layouts. Make it useful as an illustrative visual, not as factual evidence.
A Mistral AI anunciou em 23 de junho de 2026 seu novo modelo de reconhecimento óptico de caracteres (OCR), o Mistral OCR 4 — e ele não se limita a extrair texto. O modelo devolve, junto com o texto, informações estruturais como caixas delimitadoras (bounding boxes) por parágrafo, rótulos que identificam se aquele bloco é um título, tabela, equação, assinatura etc., e uma pontuação de confiança por palavra . Na prática, o OCR 4 entrega muito mais do que uma transcrição simples: ele preserva o layout e a hierarquia do documento original.
include_blocks na API — Quando ativado, cada página retorna um array blocks com rótulos estruturais e coordenadas espaciais A Mistral também reporta pontuações fortes em seu benchmark interno Crawl Multilingual, embora os números brutos não tenham sido publicados nas fontes revisadas .
| Versão | Preço | Detalhes |
|---|---|---|
| OCR Padrão | US$ 4 por 1.000 páginas | Extração básica de texto |
| Anotado (estruturado) | US$ 5 por 1.000 páginas | Inclui bounding boxes, rótulos de bloco e pontuações de confiança |
O preço é baseado em páginas, e não em tokens, o que é incomum entre os outros modelos da Mistral e reflete o caso de uso de processamento em lote de documentos.
Studio Global AI
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
O Mistral OCR 4 extrai texto com bounding boxes (caixas delimitadoras) por parágrafo, rótulos de bloco (título, tabela, equação, assinatura etc.) e pontuação de confiança por palavra [1][7][1].
O Mistral OCR 4 extrai texto com bounding boxes (caixas delimitadoras) por parágrafo, rótulos de bloco (título, tabela, equação, assinatura etc.) e pontuação de confiança por palavra [1][7][1]. Com o parâmetro 'include blocks', cada página retorna um array de blocos com coordenadas espaciais e rótulos estruturais [1].
Suporte a 170 idiomas em 10 grupos linguísticos, com ganhos de precisão em scripts raros e de baixos recursos [7][11].
Loading comments...
Comments
0 comments