OpenAI 쪽에서 가장 명확한 출처 관련 요구는 Deep Research 문서에 있습니다. 이 문서는 웹 결과 또는 웹 결과에 들어 있는 정보를 최종 사용자에게 보여줄 때, 인라인 인용이 사용자 인터페이스에서 명확히 보이고 클릭 가능해야 한다고 설명합니다 . 링크가 메타데이터 안에 숨어 있거나 주장과 떨어져 있으면 출처 추적성은 약해집니다. 이 점에서 사용자에게 보이는 인용 요건은 중요합니다.
OpenAI는 인용 가능한 자료를 준비하고 모델이 인용을 효과적으로 포맷하도록 지시하는 방법을 다룬 Citation Formatting 가이드도 제공합니다 . Deep Research API 예시는 응답에 인라인 인용이 포함된 구조화된 최종 답변, reasoning step 요약, source information이 들어간다고 설명합니다
. OpenAI Help Center 역시 Deep Research 결과물에는 사용자가 정보를 검증할 수 있도록 인용 또는 출처 링크가 포함된다고 안내합니다
.
여기서 말할 수 있는 결론은 제한적이지만 중요합니다. OpenAI는 이 문서들에서 웹 리서치 워크플로의 인용 표시를 비교적 명시적으로 설명합니다. 다만 이것이 모든 인용의 정확성을 보장한다는 뜻은 아니며, GPT-5.5 Spud라는 모델에 관한 모델별 검증 결과를 제공하는 것도 아닙니다.
Anthropic 문서에서 가장 뚜렷한 부분은 Claude Opus 4.7의 위치와 문서 기반 인용 방식입니다. Anthropic은 Claude Opus 4.7을 최신 Claude 세대의 일부로 소개하고, 가장 복잡한 작업에는 Claude Opus 4.7부터 고려하라고 설명하면서 이를 회사의 가장 강력한 일반 제공 모델로 표현합니다 .
출처 관리 관점에서 핵심은 Anthropic의 Citations 문서입니다. 이 문서는 문서를 제공하고 인용을 활성화하면 Claude가 문서에 관한 질문에 답하면서 상세 인용을 제공해 사용자가 정보 출처를 추적하고 검증하는 데 도움을 줄 수 있다고 설명합니다 . 또한 일반 텍스트와 PDF 문서는 기본적으로 문장 단위로 자동 청킹되며, 개발자가 더 세밀한 인용 단위가 필요할 때는 custom content documents를 사용할 수 있다고 합니다
. 검색증강생성, 즉 RAG 워크플로에서 청크 단위 인용을 설계할 때 중요한 지점입니다.
Anthropic의 PDF 지원 문서는 또 하나의 출처 관련 조건을 제시합니다. Converse API에서 시각적 PDF 분석을 하려면 인용을 활성화해야 한다고 설명합니다 . Anthropic은 Claude API에서 같은 콘텐츠를 요청마다 다시 올리지 않고 사용할 수 있도록 파일을 업로드하고 관리하는 Files API도 문서화하고 있습니다
. 파일 관리 자체가 인용 정확성을 증명하지는 않습니다. 하지만 저장된 원문 자료와 주장 단위 인용이 함께 설계되면 더 나은 감사 추적을 만들 수 있습니다.
연구 출처성을 평가할 때 가장 흔한 함정은 모델의 생각 과정이나 scratchpad류 산출물을 근거 자료처럼 보는 것입니다. 둘은 다릅니다.
OpenAI의 reasoning best practices 문서는 reasoning 모델이 내부적으로 추론을 수행하므로 개발자가 모델에게 단계별로 생각하라거나 chain of thought를 설명하라고 요구하지 말라고 조언합니다 . OpenAI의 reasoning models 가이드는 reasoning effort, reasoning tokens, 여러 턴에 걸친 reasoning state 유지 같은 제어 기능을 중심으로 설명합니다
.
Anthropic은 thinking 관련 용어를 더 많이 노출합니다. Prompt caching 문서는 extended thinking을 prompt caching과 함께 사용할 때 thinking blocks가 특별한 동작을 한다고 설명합니다 . Extended thinking 문서는 Claude 4 이후 모델에서 full thinking tokens와 summarized output을 구분합니다
. Anthropic release notes는 응답에서 thinking content를 생략할 수 있는 display field를 설명하고, Claude Code 문서는 skill 내용에
ultrathink를 넣으면 해당 skill에서 extended thinking을 활성화한다고 안내합니다 .
이런 기능은 복잡한 워크플로를 조정하거나 성능을 튜닝하는 데 도움이 될 수 있습니다. 그러나 scratchpad, 숨겨진 chain of thought, 요약된 reasoning trail은 특정 사실 주장이 특정 URL, 문서, 파일에서 나왔다는 증거가 아닙니다. 추론 산출물은 보조 맥락일 수 있지만, 출처 감사 추적을 대신할 수는 없습니다.
모델 이름만 비교하기 전에, 전체 리서치 워크플로가 리뷰를 견딜 수 있는지 확인해야 합니다.
검토한 문서들은 단순한 순위표가 아니라 세부적인 비교를 뒷받침합니다. OpenAI는 웹에서 가져온 정보를 사용자에게 보여줄 때 Deep Research가 명확하고 클릭 가능한 인라인 인용을 요구한다는 점에서, 사용자 대면 웹 인용 요건에 관한 근거가 가장 뚜렷합니다 . Anthropic은 문서를 제공하고 인용을 활성화하면 Claude가 문서 기반 인용을 제공하며, 문장 단위 청킹과 custom content로 인용 단위를 조정할 수 있다고 설명한다는 점에서 문서 기반 출처 추적 근거가 뚜렷합니다
.
Claude Opus 4.7은 Anthropic의 복잡한 작업용 가장 강력한 일반 제공 모델로 문서화되어 있습니다. 하지만 여기서 검토한 OpenAI의 모델별 문서는 GPT-5.4에 관한 것이지 GPT-5.5 Spud에 관한 것이 아닙니다 . 감사 가능한 AI 리서치가 목표라면, 모델명 비교에 앞서 자료 보관, 인용 단위, 검증 절차부터 비교하는 것이 더 안전합니다.
Comments
0 comments