答案已发布3个月前Last edited 2个月前14 来源

Grok 4.3 能做 OCR 吗？官方文件尚未确认

目前不能确认。可查到的 xAI 官方文档显示，Grok 可搜索和推理附加到聊天消息的文件，也具备图像理解相关能力；但未明确写明 Grok 4.3 支持从照片、扫描件或收据做 OCR 抽字。[2][4][13] 更准确的说法是：Grok 有文件上下文和图像理解能力；但“能理解图片”不等于官方承诺“可稳定做 OCR、收据解析或扫描图像文字抽取”。[2][13] 如果要用于报销、会计、审计或合规流程，应先做样本测试、保留人工复核，或等待 xAI 发布明确的 OCR/文件抽取说明。

使用 Studio Global AI 搜索并核查事实浏览更多热门页面

抽象 AI 視覺圖，文件、相片同文字辨識元素並列，代表 Grok 4.3 OCR 事實查核 — Grok 4.3 有冇 OCR？官方文件未證實可從相片、掃描件或收據抽字AI 生成示意圖：本文檢視 xAI 文件有否正式確認 Grok 4.3 OCR 能力。
AI 提示
Create a landscape editorial hero image for this Studio Global article: Grok 4.3 有冇 OCR？官方文件未證實可從相片、掃描件或收據抽字. Article summary: 未能證實：今次可查到嘅 xAI 官方文件只支持 Grok 可搜尋／推理附加文件同具備圖片理解能力，未明確寫明 Grok 4.3 可由相片、掃描件或收據做 OCR 抽字。[2][4][13]. Topic tags: ai, xai, grok, ocr, document ai. Reference image context from search candidates: Reference image 1: visual subject "最新版本Grok 4.3 Beta 於今年4 月17 日推出，在過往的基礎上，新增了六項功能：原生PDF 生成、PowerPoint 簡報輸出、Excel 試算表生成、影片輸入理解、更" source context "一手評測｜用 Grok 4.3 Beta 做出超專業簡報，PDF、影片、文字一次搞定！附 4 招免費版替代方案｜未來商務" Reference image 2: visual subject "最新版本Grok 4.3 Beta 於今年4 月17 日推出，在過往的基礎上，新增了六項功能：原生PDF 生成、PowerPoint 簡報輸出、Excel 試算表生成、影片輸入理解、更" source context "一手評測｜用 Grok 4.3 Beta 做出超專業簡報，PDF、影片、文字一次搞定！附 4 招免費版替代方案｜未來商務" Style: premium digital editorial illustration, source-backed research mood, clean composition, high detail, modern web publication hero. Use reference image context only
openai.com

先说结论：目前没有足够的官方依据证明 Grok 4.3 已正式支持 OCR。这里的 OCR，指的是从照片、扫描文件或收据图像中识别并抽取文字。现有 xAI 官方文档能够支持的说法是：Grok 可以对聊天消息中附加的文件进行搜索和推理；xAI 的 Grok 模型文档也列出 Text、Images、Video 等能力，并有 Image Understanding 相关页面。

但这些信息并没有明确写到 OCR，也没有明确承诺可以从照片、扫描件或收据中逐字抽取文字、保留字段结构或完成收据解析。因此，把它写成“Grok 4.3 已获官方确认支持 OCR”，并不严谨。

事实核查结论

基于这次提供的资料，比较稳妥的判断有三点：

xAI 文档说明，Grok 可以搜索并推理用户附加到聊天消息中的文件；文件可以通过公开 URL 引用，也可以上传私人文件后用 ID 引用，系统会自动启用 attachment_search。
xAI 的 Grok 模型页面列出模型能力包括 Text、Images、Video。

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

使用 Studio Global AI 搜索并核查事实

人们还问