Der entscheidende Fehler liegt in der unzureichenden Säuberung („Sanitization“) von Markdown-Inhalten: Alles, was ChatGPT auf einer externen Seite findet, wird potenziell zum Phishing-Vektor. Es handelt sich dabei nicht um einen Angriff auf die Server-Infrastruktur von OpenAI, sondern um eine Schwäche im clientseitigen Rendering, die das Vertrauen der Nutzer in die visuelle Darstellung von ChatGPT missbraucht.
ChatGPhish existiert nicht im luftleeren Raum. Es ist das jüngste Kapitel einer mehrjährigen Eskalation von Prompt-Injection-Techniken, die parallel zu jeder neuen Funktion von ChatGPT entstanden sind. Mit Web-Browsing, Code-Ausführung, Plugin-Unterstützung und Speicherfunktionen wuchsen auch die Angriffsflächen.
Hier die wichtigsten Wegmarken:
Das Muster ist stets dasselbe: Jede neue ChatGPT-Funktion eröffnet eine neue Angriffsfläche, und jedes Mal erweist sich der Markdown-Renderer als das schwächste Glied, weil er externen Seiten implizit vertraut.
Zum Zeitpunkt der Veröffentlichung von ChatGPhish durch Permiso Security am 29. Mai 2026 gab es von OpenAI kein öffentliches Statement und keinen Patch zu dieser spezifischen Schwachstelle .
Das bedeutet nicht, dass OpenAI in diesem Zeitraum in Sicherheitsfragen untätig war. Zwei andere, nicht mit ChatGPhish verwandte Vorfälle fielen ebenfalls in den Mai 2026:
Die Lücke zwischen der Enthüllung von ChatGPhish und einer Reaktion von OpenAI ist dennoch bemerkenswert. Öffentlich bekannt ist damit eine Phishing-Methode, für die ein Nutzer lediglich eine sorgfältig präparierte Webseite zusammenfassen lassen muss – mit ungewissem Ausgang für die Sicherheit der Betroffenen.
ChatGPhish ist deshalb so kritisch, weil es das grundlegende Vertrauen in die Benutzeroberfläche von KI-Assistenten angreift. Wenn ChatGPT im Web surft, eine Seite zusammenfasst und Links darstellt, gibt es für Nutzer keinen sichtbaren Hinweis darauf, dass diese Links von einer nicht vertrauenswürdigen Quelle stammen und nicht etwa von OpenAI selbst kuratiert wurden.
Bis OpenAI hier nachbessert, sollten Unternehmen, die ihren Mitarbeitern die Nutzung der Browsing-Funktionen von ChatGPT erlauben, die Web-Zusammenfassungen des Assistenten als potenziell gefährliche, ungeprüfte Inhalte behandeln.
Der Fall zeigt eine grundlegende architektonische Spannung auf: KI-Assistenten, die eigene Oberflächenelemente mit Inhalten aus Drittquellen mischen, benötigen Renderer, die sämtliche externen Daten als potenziell feindselig behandeln – und nicht nur als anzuzeigenden Text.
Comments
0 comments