Wenn eine Datei zu groß für einen einzigen Prompt ist, ist das MapReduce-Muster die bewährte Lösung . Es läuft in drei Schritten ab:
Diese Technik wird von Frameworks wie LangChain (eigene MapReduce-Kette) unterstützt. Wissenschaftliche Arbeiten (ACL 2025, arXiv) haben ihre Wirksamkeit für das Verständnis langer Dokumente formell bestätigt . Eine in Nature veröffentlichte Studie belegt zudem, dass der Ansatz auf Jahres- oder Jahrzehnt-Dokumentenarchive skalierbar ist, wenn man Ensemble-Prompts verwendet
.
Tipp zum Aufteilen: „Teilen Sie nach inhaltlichen Abschnitten, nicht nur nach Zeichenzahl. Absatz- und Kapitelgrenzen bewahren den Sinnzusammenhang“ .
Retrieval-Augmented Generation (RAG) geht über die reine Zusammenfassung hinaus – es ermöglicht das gezielte Abfragen konkreter Fakten aus großen Dokumentsammlungen .
Wichtiger Tipp für jede Methode: Geben Sie der KI immer einen strukturierten Prompt – legen Sie Format, Länge und Inhaltsschwerpunkte fest, anstatt nur „Fasse das zusammen“ zu sagen .
Comments
0 comments