Grok 4.3이 사진, 스캔 문서, 영수증에서 글자를 바로 뽑아낼 수 있을까? 현재 제공된 공식 자료만 놓고 보면 가장 정확한 답은 “공식적으로 확인되지 않았다”이다.
xAI 문서는 Grok이 채팅 메시지에 첨부된 문서를 검색하고 추론할 수 있다고 설명한다. 공개 URL로 파일을 참조하거나, 비공개 파일을 업로드한 뒤 ID로 참조할 수 있으며, 이 경우 시스템이 attachment_search 도구를 자동으로 활성화한다고도 적고 있다.[2] 또 Grok 모델 페이지는 모델 능력으로 Text, Images, Video를 열거하고 있으며, 별도의 Image Understanding 문서도 제공된다.[
4][
13]
하지만 이 정보만으로 “Grok 4.3이 OCR을 공식 지원한다”고 쓰기는 어렵다. 제공된 xAI 공식 문서에는 OCR, 사진 속 문자 추출, 스캔본 글자 인식, 영수증 파싱 같은 표현이 명확히 확인되지 않는다.[2][
4][
13]
사실 확인 결론
보수적으로 정리하면 다음 세 가지다.
- Grok은 채팅에 첨부한 문서를 검색하고 그 내용을 바탕으로 추론할 수 있다. 공개 파일 URL 또는 업로드한 비공개 파일 ID를 사용할 수 있으며, 이때
attachment_search가 자동 활성화된다.




