OCR 4 extrae no solo texto, sino también la estructura del documento: bounding boxes por párrafo, etiquetas de bloque (título, tabla, ecuación, firma, etc.) y puntuaciones de confianza por palabra. Lidera los benchmarks públicos OlmOCRBench (85.20) y OmniDocBench (93.07), y en pruebas ciegas con más de 600 documento...

Create a landscape editorial hero image for this Studio Global article: Search & fact check with cited sources for What are the key features, benchmark performance, pricing options, and strategic context of Mistr. Article summary: Here is the fact checked breakdown of Mistral AI's newly released OCR 4 model.. Topic tags: general web, llm, agents, ai, automation. Style: premium digital editorial illustration, source-backed research mood, clean composition, high detail, modern web publication hero. Use reference image context only for broad subject, composition, and topical grounding; do not copy the exact image. Avoid: logos, brand marks, copyrighted characters, real person likenesses, fake screenshots, UI text, readable text, watermarks, charts with fake numbers, clickbait thumbnails, icons, and tiny thumbnail layouts. Make it useful as an illustrative visual, not as factual evidence.
Mistral AI ha presentado OCR 4, su modelo de reconocimiento óptico de caracteres más avanzado hasta la fecha, que promete cambiar la forma en que las empresas procesan documentos. A diferencia de los OCR tradicionales que devuelven solo texto plano, OCR 4 entiende la estructura del documento, devolviendo información detallada sobre la ubicación y el tipo de cada elemento. A continuación, desglosamos todo lo que necesitas saber.
include_blocks en la API: Al activarlo, cada página devuelve un array blocks con etiquetas estructurales y coordenadas espaciales Mistral también reporta puntuaciones sólidas en su benchmark interno Crawl Multilingual, aunque las cifras exactas no se publicaron en las fuentes revisadas .
| Nivel | Precio | Detalles |
|---|---|---|
| OCR estándar | $4 por cada 1,000 páginas | Extracción de texto base |
| Anotado (estructurado) | $5 por cada 1,000 páginas | Incluye bounding boxes, etiquetas de bloque y puntuaciones de confianza |
El precio se basa en páginas, no en tokens, lo cual es inusual entre los otros modelos de Mistral y refleja el caso de uso de procesamiento por lotes de documentos.
Studio Global AI
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
OCR 4 extrae no solo texto, sino también la estructura del documento: bounding boxes por párrafo, etiquetas de bloque (título, tabla, ecuación, firma, etc.) y puntuaciones de confianza por palabra.
OCR 4 extrae no solo texto, sino también la estructura del documento: bounding boxes por párrafo, etiquetas de bloque (título, tabla, ecuación, firma, etc.) y puntuaciones de confianza por palabra. Lidera los benchmarks públicos OlmOCRBench (85.20) y OmniDocBench (93.07), y en pruebas ciegas con más de 600 documentos reales fue preferido frente a la competencia un 72% de las veces.
Soporta 170 idiomas en 10 grupos lingüísticos, con ganancias significativas en idiomas de baja representación como japonés, hindi y griego.
Loading comments...
Comments
0 comments