Mistral OCR 4, שהושק ב 23–24 ביוני 2026, מחזיר תיבות תוחמות ברמת פסקה, תוויות בלוק מסוגננות (כותרת, טבלה, משוואה, חתימה) וציוני אמון לכל מילה, לצד הטקסט שחולץ – תוך תמיכה ב 170 שפות. המודל מוביל את טבלת ה OlmOCRBench הציבורית עם ציון 85.20 ומשיג 93.07 ב OmniDocBench.

Create a landscape editorial hero image for this Studio Global article: Search & fact-check with cited sources for What are the key features, benchmark performance, pricing options, and strategic context of Mistr. Article summary: Here is the fact-checked breakdown of Mistral AI's newly released OCR 4 model.. Topic tags: general, documentation, general web, user generated. Style: premium digital editorial illustration, source-backed research mood, clean composition, high detail, modern web publication hero. Use reference image context only for broad subject, composition, and topical grounding; do not copy the exact image. Avoid: logos, brand marks, copyrighted characters, real person likenesses, fake screenshots, UI text, readable text, watermarks, charts with fake numbers, clickbait thumbnails, icons, and tiny thumbnail layouts. Make it useful as an illustrative visual, not as factual e
Mistral AI שחררה את OCR 4 ב-23–24 ביוני 2026, ומסמנת מעבר מחילוץ טקסט גולמי להבנה מבנית של מסמכים. המודל תוכנן כרכיב הזנה (ingestion component) עבור חיפוש ארגוני, צינורות RAG (Retrieval-Augmented Generation) וזרימות עבודה אוטונומיות (agentic workflows), והוא מושק במקביל ל-Mistral Document AI ול-Mistral Medium 3.5 בפלטפורמת Microsoft Azure AI Foundry .
חילוץ מודע למבנה. OCR 4 מחזיר תיבות תוחמות ברמת פסקה, תוויות סוג בלוק (טקסט, כותרת, רשימה, טבלה, תמונה, משוואה, כיתוב, קוד, הפניות, טקסט צדדי, כותרת עליונה, כותרת תחתונה, חתימה) וציוני אמון לכל מילה, לצד הטקסט שחולץ . זה מאפשר שימוש ישיר בפלט למעקב אחר ציטוטים, השחרה (redaction) וחלוקה סמנטית (semantic chunking) ללא צורך בעיבוד נוסף
.
פרמטר API include_blocks. כאשר מופעל, כל עמוד מחזיר מערך blocks עם תוויות מבניות וקואורדינטות מרחביות בסדר קריאה .
170 שפות ב-10 קבוצות שפה. Mistral מדווחת על שיפורי דיוק משמעותיים במיוחד בכתבות נדירות ובעלות משאבים מוגבלים, כולל יפנית, הינדית ויוונית .
אירוח עצמי בקונטיינר בודד. ניתן לפרוס את המודל כולו על תשתית מקומית (on-premises) בקונטיינר יחיד – יתרון מבדל משמעותי עבור תעשיות מוסדרות שאינן יכולות לשלוח מסמכים ל-API חיצוני .
קלט מולטימודאלי ופלט מובנה. OCR 4 מקבל קלט בפורמט PDF ותמונות (מסמכי Office באמצעות המרה) ומוציא פלט Markdown ו-JSON מובנים, המיועדים להשתלבות בצינורות RAG וזרימות אוטונומיות .
Mistral מדווחת גם על ציונים חזקים במבחן הפנימי שלה Crawl Multilingual, אם כי המספרים הגולמיים לא פורסמו במקורות שנבדקו .
| רמה | מחיר | פרטים |
|---|---|---|
| OCR רגיל | 4 דולר ל-1,000 עמודים | חילוץ טקסט בסיסי |
| מבואר (מובנה) | 5 דולר ל-1,000 עמודים | כולל תיבות תוחמות, תוויות בלוק וציוני אמון |
התמחור מבוסס על עמודים, לא על אסימונים (tokens), דבר יוצא דופן במודלים האחרים של Mistral ומשקף את מקרה השימוש של עיבוד קבוצות מסמכים.
OCR 4 מסמן מעבר מכוון מ"חילוץ טקסט" ל"הבנת מסמכים." הוא ממוצב כשכבה בסיסית לחיפוש ארגוני, צינורות RAG וזרימות אוטונומיות, שבהן שימור הפריסה והמבנה (טבלאות, משוואות, חתימות) הוא קריטי . הוא מכוון ישירות למתחרים כמו Google Document AI, Azure Document Intelligence וצינורות OCR בקוד פתוח, בכך שהוא משלב פלט מובנה במחיר סחיר עם אפשרות לאירוח עצמי – שילוב נדיר בקרב ממשקי OCR מרכזיים
.
עיצוב הקונטיינר הבודד הוא יתרון מבדל עבור מגזרים כמו פיננסים, בריאות ומשפט, הדורשים ריבונות נתונים . Mistral הפכה את OCR 4 למודל ברירת המחדל להבנת מסמכים עבור מיליוני משתמשים בפלטפורמת Le Chat
.
Studio Global AI
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
Mistral OCR 4, שהושק ב 23–24 ביוני 2026, מחזיר תיבות תוחמות ברמת פסקה, תוויות בלוק מסוגננות (כותרת, טבלה, משוואה, חתימה) וציוני אמון לכל מילה, לצד הטקסט שחולץ – תוך תמיכה ב 170 שפות.
Mistral OCR 4, שהושק ב 23–24 ביוני 2026, מחזיר תיבות תוחמות ברמת פסקה, תוויות בלוק מסוגננות (כותרת, טבלה, משוואה, חתימה) וציוני אמון לכל מילה, לצד הטקסט שחולץ – תוך תמיכה ב 170 שפות. המודל מוביל את טבלת ה OlmOCRBench הציבורית עם ציון 85.20 ומשיג 93.07 ב OmniDocBench.
Loading comments...
Comments
0 comments