이 기법은 LangChain(내장 MapReduce 체인) 같은 프레임워크에서 지원되며, ACL 2025 및 arXiv의 학술 논문에서도 장문 문서 이해에 효과적임이 공식 검증되었습니다 . Nature에 게재된 연구는 앙상블 프롬프트를 활용해 이 방식이 연간/10년 단위 문서 코퍼스까지 확장 가능함을 확인했습니다
.
| 상황 | 최적 방법 |
|---|---|
| 단일 문서, 약 200쪽 이하 | 직접 업로드 + 구조화된 프롬프트 |
| 단일 문서, 약 200쪽 초과 또는 컨텍스트 한도 초과 | MapReduce 요약 |
| 여러 개의 대용량 문서 또는 빈번한 질의응답 | RAG (청킹 + 인덱싱 + 검색) |
| 스캔된 PDF 또는 이미지 문서 | 청킹 전에 OCR 도구(unstructured.io, LlamaParse) 사용 |
모든 방법에 중요한 팁: AI에 항상 구조화된 프롬프트를 제공하세요. 형식, 길이, 집중할 내용을 지정하는 것이 "이것을 요약해 줘"라는 일반적인 요청보다 훨씬 좋은 결과를 얻습니다 .
Comments
0 comments