أطلقت Mistral AI نموذج OCR 4 في 23 24 يونيو 2026، ويعيد تعريف استخراج المستندات بإرجاع مربعات إحاطة على مستوى الفقرة، وتصنيفات كتل (عنوان، جدول، معادلة، توقيع)، ودرجات ثقة لكل كلمة، مع دعم 170 لغة عبر 10 مجموعات لغوية. يتصدر النموذج لوحة OlmOCRBench العامة بنتيجة 85.20 ويسجل 93.07 على OmniDocBench، مع تفضيل بنسبة 72...

Create a landscape editorial hero image for this Studio Global article: Search & fact-check with cited sources for What are the key features, benchmark performance, pricing options, and strategic context of Mistr. Article summary: Here is the fact-checked breakdown of Mistral AI's newly released OCR 4 model.. Topic tags: general, documentation, general web, user generated. Style: premium digital editorial illustration, source-backed research mood, clean composition, high detail, modern web publication hero. Use reference image context only for broad subject, composition, and topical grounding; do not copy the exact image. Avoid: logos, brand marks, copyrighted characters, real person likenesses, fake screenshots, UI text, readable text, watermarks, charts with fake numbers, clickbait thumbnails, icons, and tiny thumbnail layouts. Make it useful as an illustrative visual, not as factual e
أصدرت شركة Mistral AI نموذج OCR 4 في الفترة من 23 إلى 24 يونيو 2026، في تحول جوهري من مجرد استخراج النص العادي إلى فهم منظم للمستندات. صُمم هذا النموذج ليكون مكونًا أساسيًا لسير عمل البحث المؤسسي، وأنظمة RAG (التوليد المعزز بالاسترجاع)، وسير العمل الذكي القائم على العوامل. يأتي النموذج جنبًا إلى جنب مع إطلاق Mistral Document AI وMistral Medium 3.5 على منصة Microsoft Azure AI Foundry .
استخراج واعٍ بالهيكل. يعيد OCR 4 مربعات إحاطة على مستوى الفقرة، وتصنيفات لأنواع الكتل (نص، عنوان، قائمة، جدول، صورة، معادلة، تسمية توضيحية، كود، مراجع، نص هامشي، رأس، تذييل، توقيع)، إلى جانب درجات ثقة لكل كلمة إلى جانب النص المستخرج . هذا يجعل المخرجات قابلة للاستخدام مباشرة في تتبع الاستشهادات، والتنقيح، والتجزئة الدلالية دون الحاجة إلى معالجة لاحقة
.
معامل API include_blocks. عند تفعيله، تُعيد كل صفحة مصفوفة blocks تحتوي على تسميات هيكلية وإحداثيات مكانية بترتيب القراءة .
دعم 170 لغة عبر 10 مجموعات لغوية. تذكر Mistral تحقيق تحسينات دقة ملحوظة في اللغات النادرة وذات الموارد المحدودة، بما في ذلك اليابانية والهندية واليونانية .
استضافة ذاتية بحاوية واحدة. يمكن نشر النموذج بالكامل داخل الشركة في حاوية واحدة، وهي ميزة تفاضلية رئيسية للصناعات الخاضعة للتنظيم التي لا يمكنها إرسال المستندات إلى واجهات برمجة تطبيقات خارجية .
إدخال متعدد الوسائط وإخراج منظم. يقبل OCR 4 ملفات PDF والصور (يتم تحويل مستندات Office عبر التحويل) ويُخرج بصيغ Markdown و JSON المهيكلة، والمصممة للتكامل مع أنظمة RAG والعوامل الذكية .
كما تذكر Mistral تحقيق درجات قوية على معيارها الداخلي Crawl Multilingual، على الرغم من عدم نشر الأرقام الأولية في المصادر التي تمت مراجعتها .
| المستوى | السعر | التفاصيل |
|---|---|---|
| OCR القياسي | 4 دولارات لكل 1000 صفحة | استخراج النص الأساسي |
| المُعلَّق (المنظم) | 5 دولارات لكل 1000 صفحة | يشمل مربعات الإحاطة وتصنيفات الكتل ودرجات الثقة |
التسعير قائم على عدد الصفحات وليس الرموز المميزة (tokens)، وهو أمر غير معتاد بين نماذج Mistral الأخرى ويعكس حالة الاستخدام الخاصة بدفعات المستندات.
يمثل OCR 4 تحولًا متعمدًا من "استخراج النص" إلى "فهم المستندات". فهو يُوضع كطبقة أساسية للبحث المؤسسي، وخطوط أنابيب RAG، وسير العمل الذكي حيث يكون الحفاظ على التخطيط والهيكل (الجداول، المعادلات، التوقيعات) أمرًا بالغ الأهمية . يستهدف النموذج بشكل مباشر Google Document AI وAzure Document Intelligence وخطوط أنابيب OCR مفتوحة المصدر، وذلك من خلال الجمع بين المخرجات المنظمة بأسعار تنافسية مع خيار الحاوية ذاتية الاستضافة – وهو مزيج نادر بين واجهات OCR الرئيسية
.
يعد التصميم بحاوية واحدة ميزة تفاضلية رئيسية لقطاعات المالية والرعاية الصحية والقانونية التي تتطلب سيادة البيانات . كما جعلت Mistral من OCR 4 النموذج الافتراضي لفهم المستندات عبر ملايين المستخدمين على منصة Le Chat
.
Studio Global AI
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
أطلقت Mistral AI نموذج OCR 4 في 23 24 يونيو 2026، ويعيد تعريف استخراج المستندات بإرجاع مربعات إحاطة على مستوى الفقرة، وتصنيفات كتل (عنوان، جدول، معادلة، توقيع)، ودرجات ثقة لكل كلمة، مع دعم 170 لغة عبر 10 مجموعات لغوية.
أطلقت Mistral AI نموذج OCR 4 في 23 24 يونيو 2026، ويعيد تعريف استخراج المستندات بإرجاع مربعات إحاطة على مستوى الفقرة، وتصنيفات كتل (عنوان، جدول، معادلة، توقيع)، ودرجات ثقة لكل كلمة، مع دعم 170 لغة عبر 10 مجموعات لغوية. يتصدر النموذج لوحة OlmOCRBench العامة بنتيجة 85.20 ويسجل 93.07 على OmniDocBench، مع تفضيل بنسبة 72% في تقييمات بشرية عمياء على أكثر من 600 مستند و12 لغة.
تتضمن خيارات التسعير 4 دولارات لكل 1000 صفحة للاستخراج الأساسي و5 دولارات للاستخراج المنظم، مع ميزة الاستضافة الذاتية في حاوية واحدة للقطاعات الخاضعة للرقابة.
Loading comments...
Comments
0 comments