blocks170言語対応:10の言語グループに分類。特に日本語、ヒンディー語、ギリシャ語など、多くのOCRシステムで精度が落ちやすい「特殊言語カテゴリ」や低リソース言語でも改善が見られるとMistral AIは説明しています。
単一コンテナでのセルフホスティング:モデル全体を1つのコンテナに収め、完全にオンプレミスでデプロイ可能。データを外部APIに送信できない金融、医療、法務などの規制業界にとって大きな差別化ポイントです。
| ベンチマーク | OCR 4 スコア | 備考 |
|---|---|---|
| OlmOCRBench(公開リーダーボード) | 85.20 | リリース時点でトップ |
| OmniDocBench | 93.07 | 多様な文書タイプで高スコア |
| 人間評価(ブラインド、600以上の文書、12言語以上) | 平均72%の勝率 | 独立した評価者が競合OCRと比較して選好 |
OCR 4のリリースは、Mistral AIにとって「テキスト抽出」から「文書理解」への明確な戦略転換を示しています。同社はOCR 4を、エンタープライズ検索、RAGパイプライン、エージェント型ワークフローのための基礎レイヤーとして位置づけています。
競合としては、GoogleのDocument AI、Azure Document Intelligence、そしてオープンソースのOCRパイプラインを直接ターゲット。構造化出力をコモディティ価格で提供しつつ、セルフホスティング対応という、主要OCR APIの中では稀有な組み合わせを実現しています。
Comments
0 comments