include_blocksblocksรองรับ 170 ภาษาใน 10 กลุ่มภาษา Mistral รายงานว่ามีความแม่นยำเพิ่มขึ้นเป็นพิเศษสำหรับภาษาที่มีทรัพยากรน้อย เช่น ญี่ปุ่น ฮินดี และกรีก
โฮสต์เองในคอนเทนเนอร์เดียว โมเดลสามารถปรับใช้ภายในองค์กรได้ทั้งหมดในคอนเทนเนอร์เดียว เป็นจุดแตกต่างสำคัญสำหรับอุตสาหกรรมที่มีกฎระเบียบซึ่งไม่สามารถส่งเอกสารไปยัง API ภายนอกได้
อินพุตหลายรูปแบบและเอาต์พุตเชิงโครงสร้าง OCR 4 รองรับไฟล์ PDF และรูปภาพ (เอกสาร Office ผ่านการแปลง) และส่งออก Markdown และ JSON แบบมีโครงสร้าง ออกแบบมาเพื่อบูรณาการกับ RAG และ agentic pipelines
Mistral ยังรายงานคะแนนที่แข็งแกร่งในเกณฑ์มาตรฐานภายในองค์กร Crawl Multilingual แม้จะไม่ได้เผยแพร่ตัวเลขดิบในแหล่งที่มาตรวจสอบ
| ระดับ | ราคา | รายละเอียด |
|---|---|---|
| OCR มาตรฐาน | $4 ต่อ 1,000 หน้า | การสกัดข้อความพื้นฐาน |
| OCR แบบมีคำอธิบาย (โครงสร้าง) | $5 ต่อ 1,000 หน้า | รวมพิกัดกรอบ, ป้ายกำกับบล็อก และคะแนนความเชื่อมั่น |
ราคาคิดตามจำนวนหน้า ไม่ใช่ตามจำนวนโทเคน ซึ่งถือว่าแตกต่างจากโมเดลอื่นของ Mistral และสะท้อนถึงกรณีการใช้งานแบบประมวลผลเอกสารเป็นชุด
OCR 4 เป็นการเปลี่ยนแปลงอย่างตั้งใจจาก "การสกัดข้อความ" ไปสู่ "การทำความเข้าใจเอกสาร" โดยวางตำแหน่งเป็นเลเยอร์พื้นฐานสำหรับการค้นหาในองค์กร, RAG pipelines และเวิร์กโฟลว์แบบอัตโนมัติ ซึ่งการรักษาเลย์เอาต์และโครงสร้าง (ตาราง, สมการ, ลายเซ็น) มีความสำคัญ มันเข้าปะทะโดยตรงกับ Google Document AI, Azure Document Intelligence และ OCR pipeline โอเพนซอร์ส ด้วยการผสมผสานระหว่างเอาต์พุตที่มีโครงสร้างในราคาทั่วไปกับตัวเลือกคอนเทนเนอร์ที่โฮสต์เองได้ ซึ่งเป็นการผสมผสานที่หาได้ยากใน API OCR รายใหญ่
Comments
0 comments