Die beste Faustregel lautet: Behandle ChatGPT und andere KI-Tools zunächst wie externe Cloud-Dienste. Was öffentlich, synthetisch oder wirklich anonymisiert ist, ist meist unkritischer. Was Personen identifiziert, Zugang ermöglicht, vertraglich vertraulich ist oder Geschäftsgeheimnisse enthält, gehört nicht in ein ungeprüftes Consumer-Tool.
Der Grund ist einfach: OpenAI beschreibt in seiner Datenschutzrichtlinie, dass personenbezogene Daten erfasst werden können, die Nutzer:innen als Content in die Dienste eingeben — einschließlich Prompts und Uploads wie Dateien, Bilder, Audio- und Videoinhalte.[5] Deshalb reicht die Frage, ob ein Tool mit deinen Eingaben trainiert, allein nicht aus. Entscheidend ist: Darf genau dieses Tool genau diese Daten für genau diesen Zweck verarbeiten?
Die Datenampel für ChatGPT und andere KI-Tools
| Kategorie | Beispiele | Empfehlung |
|---|---|---|
| Grün | Öffentliche Informationen, allgemeine Fragen, selbst erfundene Beispiele, Dummy-Daten, synthetische Datensätze, wirklich anonymisierte Ausschnitte | In der Regel geeignet, solange keine personenbezogenen, vertraulichen oder geschützten Informationen enthalten sind. |
| Gelb | Interne Texte ohne Geheimnisse, anonymisierte Supportfälle, Code ohne Secrets, Tabellen nach Entfernten von Namen, IDs und Kontaktdaten | Nur mit Datenminimierung, freigegebenem Tool und geprüften Einstellungen zu Training, Speicherung und Zugriff verwenden. |
| Rot | Passwörter, API-Keys, Tokens, Zugangsdaten, Ausweis-, Konto- oder Steuerdaten, Gesundheits- und Patientendaten, vollständige Kunden- oder Mitarbeiterdaten, vertrauliche Verträge, M&A-Unterlagen, unveröffentlichte Finanzzahlen, Quellcode mit Secrets oder Kern-IP | Nicht in ungeprüfte Consumer-Tools kopieren. Falls Verarbeitung nötig ist, nur über eine freigegebene Business-, Enterprise- oder API-Umgebung und nach interner Freigabe. |
Diese Ampel ist keine Rechtsberatung, sondern ein pragmatischer Sicherheitsfilter. Je leichter ein Inhalt Personen, Kund:innen, Mitarbeitende, Patient:innen, Verträge oder interne Systeme identifizierbar macht, desto konservativer solltest du entscheiden.
Warum Consumer-ChatGPT besondere Vorsicht verlangt
Ein Chat in Consumer-ChatGPT ist keine lokale Notiz. OpenAI sagt, dass User Content personenbezogene Daten enthalten kann und nennt Prompts sowie Uploads ausdrücklich als Beispiele.[5]
Die Datenkontrollen in ChatGPT sollen Nutzer:innen entscheiden lassen, ob ihre Unterhaltungen und Interaktionen zur Verbesserung der Modelle beitragen.[9] Diese Einstellung zu deaktivieren kann ein wichtiger Schutzschritt sein. Sie macht sensible Inhalte aber nicht automatisch zulässig, denn sie beantwortet nur einen Teil der Datenschutz- und Compliance-Fragen.
Temporary Chats reduzieren bestimmte Risiken: OpenAI beschreibt sie als nicht im Verlauf gespeichert, nicht für Memories verwendet, nicht zum Training genutzt und nach 30 Tagen gelöscht; sie können laut OpenAI weiterhin zur Missbrauchsüberwachung geprüft werden.[9][
11] Für vertrauliche Geschäftsunterlagen, echte Kundendaten oder Gesundheitsdaten sind Temporary Chats daher kein Freibrief.
Was Business, Enterprise, Edu, Healthcare und API ändern
OpenAI unterscheidet Consumer-Nutzung von geschäftlichen Produkten. Als Business-Daten beschreibt OpenAI Inputs und Outputs aus ChatGPT Business, ChatGPT Enterprise, ChatGPT for Healthcare, ChatGPT Edu, ChatGPT for Teachers und der API Platform.[7]
Für diese Business-Daten sagt OpenAI, dass sie standardmäßig nicht zum Training verwendet werden.[7] Außerdem kann OpenAI für ChatGPT Business, ChatGPT Enterprise und die API ein Data Processing Addendum zur Unterstützung von DSGVO- und anderen Datenschutzanforderungen abschließen; für ChatGPT Edu und ChatGPT for Teachers verweist OpenAI auf ein Student Data Privacy Agreement.[
7] OpenAI stellt zusätzlich Informationen zu Business Data Privacy, Security, Compliance und Data-Retention-Policies für Enterprise, Business, Edu, ChatGPT for Healthcare und die API bereit.[
6]
Trotzdem bedeutet ein Business-Produkt nicht automatisch, dass jede Dateneingabe erlaubt ist. Unternehmen müssen weiterhin Zweck, Datentyp, Berechtigungskonzept, Aufbewahrung, interne Richtlinien, Kund:innenverträge und regulatorische Vorgaben prüfen.
Die wichtigsten Prüffragen vor jedem Upload
Bevor echte Daten in ein KI-Tool eingegeben oder hochgeladen werden, sollten mindestens diese Fragen geklärt sein:
- Ist das Tool von Datenschutz, Legal und IT freigegeben?
- Nutzt der Anbieter Prompts, Dateien oder Ausgaben für Training oder Modellverbesserung?
- Gibt es eine Opt-out-Einstellung oder einen vertraglichen Ausschluss der Trainingsnutzung?
- Wie lange werden Eingaben, Uploads und Ausgaben gespeichert?
- Können Menschen beim Anbieter Inhalte prüfen, etwa für Support, Sicherheit oder Missbrauchsüberwachung?
- Welche Dritt-Apps, Connectoren, Plugins oder Subprozessoren können Zugriff erhalten?
- Gibt es DPA/AVV, Admin-Kontrollen, Rollenrechte, Audit-Möglichkeiten und klare Aufbewahrungsregeln?
- Erlauben interne Richtlinien und externe Verträge die Verarbeitung genau dieser Daten in genau diesem Tool?
Wenn diese Punkte nicht eindeutig beantwortet sind, arbeite mit Platzhaltern, anonymisierten Ausschnitten oder synthetischen Daten.
Bessere Prompt-Praxis: minimieren statt kopieren
Der sicherste Prompt enthält nur das, was für die Aufgabe wirklich nötig ist. Entferne Namen, E-Mail-Adressen, Telefonnummern, Adressen, Kundennummern, Patientennummern, Vertragsnummern und andere Identifikatoren, wenn sie für die Antwort nicht gebraucht werden.
Kundenfälle: Statt einen vollständigen Fall mit Name, Kundennummer und Kontaktdaten zu kopieren, nutze Platzhalter wie [KUNDE], [KUNDENNUMMER] und [DATUM].
Tabellen: Lade keine vollständigen Kund:innen- oder Mitarbeiterlisten hoch. Entferne direkte Identifikatoren und beschränke dich auf die Spalten, die für die Analyse notwendig sind.
Code: Kopiere keine API-Keys, Tokens, privaten Zertifikate, Passwörter oder produktionsnahen Zugangsdaten in Prompts. Teile nur den relevanten Codeausschnitt und ersetze Konfigurationswerte durch Platzhalter.
Verträge und Finanzdaten: Wenn nur eine Klausel, ein Muster oder eine Formulierung geprüft werden soll, nutze einen anonymisierten Ausschnitt statt des vollständigen Dokuments.
Wenn echte Daten verarbeitet werden müssen
Manchmal reichen Dummy-Daten nicht. Dann sollte die Reihenfolge konservativ sein:
- Zweck klären: Prüfe, ob das Modell wirklich echte Daten braucht oder ob ein anonymisierter Ausschnitt genügt.
- Daten minimieren: Verwende nur den kleinsten notwendigen Datensatz.
- Identifikatoren entfernen: Reduziere Personen-, Kunden-, Patienten- und Organisationsbezüge so weit wie möglich.
- Secrets löschen: Passwörter, Tokens, API-Keys und private Zertifikate gehören nicht in Prompts.
- Freigegebene Umgebung wählen: Für Unternehmensdaten sollte ein geprüftes Business-, Enterprise- oder API-Setup genutzt werden; OpenAI beschreibt für diese Produkte separate Enterprise-Privacy-Regeln einschließlich standardmäßig keinem Training auf Business-Daten.[
7]
- Einstellungen und Verträge prüfen: Kläre Trainingsnutzung, Speicherung, Rollenrechte, DPA/AVV und Aufbewahrung vorab.[
6][
7][
9]
- Nutzung dokumentieren: Halte Tool, Zweck, Datentyp, Einstellungen und Freigabe nachvollziehbar fest.
Kurzfazit
Es gibt kein pauschales „ChatGPT ja“ oder „ChatGPT nein“. Im Consumer-Kontext können Prompts und Uploads personenbezogene Daten enthalten und von OpenAI als User Content erfasst werden.[5] Datenkontrollen und Temporary Chats beeinflussen, ob Unterhaltungen zur Modellverbesserung, im Verlauf oder für Memories genutzt werden; Temporary Chats werden laut OpenAI nach 30 Tagen gelöscht, können aber weiterhin zur Missbrauchsüberwachung geprüft werden.[
9][
11]
Für Business-, Enterprise-, Edu-, Healthcare- und API-Nutzung beschreibt OpenAI eigene Regeln, darunter standardmäßig kein Training auf Business-Daten.[7] Wenn du unsicher bist, gilt die konservative Regel: nicht einfügen. Erst anonymisieren, mit Platzhaltern arbeiten oder ein freigegebenes Business-, Enterprise- oder API-Setup nutzen.




