Giskard Guards: Sicherheits‑ und Governance‑Layer für KI‑Agenten in Unternehmen
Giskard Guards fungiert als Runtime‑Sicherheits‑ und Governance‑Layer für Enterprise‑KI‑Agenten und überwacht deren gesamte Ausführungskette statt nur Eingaben oder Antworten. Moderne Agent‑Systeme greifen auf Daten zu, rufen Tools auf und führen mehrstufige Workflows aus – dadurch entstehen Risiken wie Prompt‑Injec...
How is the French startup Giskard addressing the growing security and governance risks of enterprise AI agents with its Giskard Guards platfEnterprise AI agents introduce new security and governance challenges as they interact with tools, data, and automated workflows.
KI-Prompt
Create a landscape editorial hero image for this Studio Global article: How is the French startup Giskard addressing the growing security and governance risks of enterprise AI agents with its Giskard Guards platf. Article summary: Giskard is positioning Giskard Guards as a runtime security and governance layer for enterprise AI agents: instead of only filtering a user prompt or final model output, it evaluates the agent’s broader execution context. Topic tags: general, academic, general web, government. Reference image context from search candidates: Reference image 1: visual subject "The scale of the problem AI agents are proliferating across enterprise environments faster than security teams can track 10,000+ Apps on average in a single enterprise environment" source context "Enterprise AI Agent Security and Governance: Managing Risks in 2026 | PPTX" Reference image 2: visual subject "
openai.com
KI‑Agenten entwickeln sich rasant von experimentellen Tools zu zentralen Bausteinen realer Unternehmensprozesse. Sie durchsuchen Dokumente, greifen auf APIs zu und führen mehrstufige Aufgaben in Geschäftssystemen aus. Genau diese Fähigkeiten bringen jedoch neue Risiken mit sich – von Prompt‑Injection über Halluzinationen bis hin zu Datenlecks oder unsicheren Tool‑Aufrufen.
Das französische Startup Giskard versucht diese Lücke mit Giskard Guards zu schließen: einer Sicherheits‑ und Governance‑Plattform, die speziell für Enterprise‑KI‑Agenten entwickelt wurde. Statt Sicherheit nur als Inhaltsfilter zu verstehen, soll das System den gesamten Ausführungsprozess eines Agenten überwachen und Unternehmensrichtlinien in Echtzeit durchsetzen.
Das Sicherheitsproblem moderner KI‑Agenten
Frühere Sicherheitsmechanismen für KI konzentrierten sich hauptsächlich auf das Filtern von Nutzereingaben oder generierten Texten. Das funktionierte relativ gut, solange Sprachmodelle vor allem als Chat‑Interfaces mit statischen Antworten genutzt wurden.
Moderne Enterprise‑Agenten arbeiten jedoch ganz anders. Sie können beispielsweise:
externe Dokumente oder interne Unternehmensdaten abrufen
APIs und Automatisierungs‑Tools aufrufen
mehrstufige Workflows planen und ausführen
mit sensiblen Betriebssystemen interagieren
Dadurch verschiebt sich das zentrale Risiko von „problematischen Inhalten“ zu „problematischem Verhalten“. Agenten können Fakten halluzinieren, schädliche Anweisungen aus abgerufenen Dokumenten übernehmen, vertrauliche Daten preisgeben oder unbeabsichtigte Aktionen über angebundene Tools ausführen. Solche Fehler können Geschäftsprozesse stören oder sensible Informationen offenlegen.
Traditionelle Guardrails – häufig einfache Keyword‑ oder Klassifikationsfilter – geraten hier an ihre Grenzen. Ihnen fehlt oft der operative Kontext, um komplexe Angriffsmuster zu erkennen. Gleichzeitig blockieren sie teilweise legitime Anfragen, während raffinierte Angriffe wie mehrstufige Prompt‑Injection dennoch durchrutschen können.
Studio Global AI
Search, cite, and publish your own answer
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
Wie lautet die kurze Antwort auf „Giskard Guards: Sicherheits‑ und Governance‑Layer für KI‑Agenten in Unternehmen“?
Giskard Guards fungiert als Runtime‑Sicherheits‑ und Governance‑Layer für Enterprise‑KI‑Agenten und überwacht deren gesamte Ausführungskette statt nur Eingaben oder Antworten.
Was sind die wichtigsten Punkte, die zuerst validiert werden müssen?
Giskard Guards fungiert als Runtime‑Sicherheits‑ und Governance‑Layer für Enterprise‑KI‑Agenten und überwacht deren gesamte Ausführungskette statt nur Eingaben oder Antworten. Moderne Agent‑Systeme greifen auf Daten zu, rufen Tools auf und führen mehrstufige Workflows aus – dadurch entstehen Risiken wie Prompt‑Injection, Halluzinationen oder Datenlecks, die klassische Moderationsfilter oft...
Was soll ich als nächstes in der Praxis tun?
Mit kontextbewussten Guardrails, mehreren Sicherheitsdetektoren und einem Policy‑as‑Code‑Ansatz will Giskard besonders regulierten Branchen helfen, KI‑Agenten sicher und EU‑AI‑Act‑konform einzusetzen.
Giskard Guards: Eine Sicherheits‑Schicht für Agent‑Workflows
Giskard positioniert Guards als eine Art Sicherheits‑Layer zwischen KI‑Agenten und den Systemen, mit denen sie interagieren.
Anstatt nur Prompt oder Antwort zu prüfen, analysiert die Plattform den gesamten Kontext der Agent‑Ausführung – einschließlich Zwischenentscheidungen, Tool‑Aufrufen und generierten Ergebnissen. Ziel ist es, riskantes Verhalten zu erkennen, bevor es reale Systeme erreicht.
Zu den zentralen Konzepten gehören:
Kontextbewusste Guardrails
Das System bewertet nicht nur Schlüsselwörter, sondern die Absicht und den Kontext einer Interaktion. Dadurch können Regeln berücksichtigen, welche Aufgabe ein Agent gerade erfüllt, welche Tools verbunden sind und auf welche Daten zugegriffen wird.
Mehrschichtige Erkennungssysteme
Giskard Guards kombiniert mehrere Detektoren, etwa für Jailbreak‑Versuche, Prompt‑Injection, sensible Daten oder Richtlinienverstöße. Je nach Ergebnis kann eine Aktion erlaubt, überwacht oder blockiert werden.
Überwachung der gesamten Ausführungskette
Viele Angriffe entstehen nicht im Prompt selbst, sondern in Zwischenschritten – etwa durch manipulierte Inhalte in abgerufenen Dokumenten oder riskante Tool‑Aufrufe. Deshalb analysiert die Plattform die komplette Aktionskette eines Agenten.
Policy‑as‑Code: Governance für KI‑Systeme
Ein zentrales Designprinzip hinter der Plattform ist „Policy‑as‑Code“.
Unternehmen besitzen bereits zahlreiche Regeln – etwa Datenschutzrichtlinien, Compliance‑Vorgaben oder interne Sicherheitsstandards. Policy‑as‑Code übersetzt solche Regeln in maschinell durchsetzbare Kontrollen.
Forschung zu KI‑Agenten‑Governance zeigt, dass Richtlinien aus Dokumenten oder technischen Spezifikationen in automatisierte Guardrails übersetzt werden können, die Agentenaktivitäten in Echtzeit überwachen.
Damit lassen sich beispielsweise Regeln definieren wie:
medizinische oder finanzielle Daten dürfen nicht offengelegt werden
Entscheidungen mit hoher Wirkung erfordern menschliche Freigabe
bestimmte Tools dürfen nur eingeschränkt genutzt werden
alle Aktionen werden für Audits protokolliert
Da diese Regeln versioniert und programmierbar sind, können sie sich parallel zu schnell weiterentwickelnden KI‑Systemen anpassen.
Bezug zum EU AI Act
Ein wichtiger Treiber für solche Governance‑Mechanismen ist die Regulierung.
Der EU AI Act führt ein risikobasiertes Regelwerk für KI ein. Systeme mit hohem Risiko – etwa solche, die Gesundheit, Sicherheit, Beschäftigung oder grundlegende Rechte betreffen – müssen umfangreiche Anforderungen erfüllen, darunter Risikomanagement, Dokumentation, Transparenz, Protokollierung, Robustheit und menschliche Aufsicht.
Plattformen wie Giskard Guards versuchen Unternehmen bei diesen Anforderungen zu unterstützen, etwa durch:
Solche Funktionen können insbesondere Anforderungen wie menschliche Aufsicht und technische Robustheit unterstützen.
Besonders relevant für regulierte Branchen
Der Bedarf an Agent‑Governance ist besonders groß in stark regulierten Bereichen.
Banken und Versicherungen nutzen KI‑Agenten zunehmend für Aufgaben wie Risikoanalyse, Betrugserkennung, Schadenbearbeitung oder Kundensupport. Diese Prozesse beinhalten sensible Finanzdaten und unterliegen strengen regulatorischen Vorgaben.
Im Gesundheitswesen sind die Risiken noch höher. Agenten könnten Patientenakten zusammenfassen, medizinische Informationen abrufen oder Dokumentation unterstützen. Guardrails müssen sicherstellen, dass vertrauliche Gesundheitsdaten geschützt bleiben und automatisierte Vorschläge nicht notwendige menschliche Entscheidungen umgehen.
Deshalb setzen viele Unternehmen auf Sicherheitskontrollen auf Infrastruktur‑Ebene statt ausschließlich auf Prompt‑Regeln.
Europas Strategie für souveräne KI‑Infrastruktur
Giskard positioniert Guards auch im Kontext einer breiteren europäischen Strategie für „souveräne KI“.
Die Plattform unterstützt On‑Premise‑ oder kontrollierte Deployments, sodass sensible Daten, Telemetrie und Sicherheitskontrollen innerhalb der Infrastruktur eines Unternehmens bleiben können.
Für Organisationen, die unter europäischen Datenschutz‑ und KI‑Regeln wie DSGVO und EU AI Act arbeiten, kann die Kontrolle über den Standort von Sicherheits‑ und Monitoring‑Systemen ein entscheidender Faktor sein.
Der größere Wandel: Verhalten statt Inhalte absichern
Mit dem Aufstieg von KI‑Agenten verändert sich auch die Art, wie Sicherheitssysteme funktionieren müssen. Systeme, die nur Eingaben oder generierte Texte analysieren, können die Komplexität agentischer Workflows kaum erfassen.
Der Ansatz von Giskard spiegelt deshalb einen größeren Trend wider: nicht nur Inhalte zu moderieren, sondern das Verhalten von KI‑Agenten über den gesamten Workflow hinweg zu überwachen und Richtlinien in Echtzeit durchzusetzen.
Ob solche Plattformen langfristig komplexe Fehler in großskaligen Unternehmensumgebungen zuverlässig verhindern können, bleibt abzuwarten. Klar ist jedoch, dass kontextbewusste, richtliniengesteuerte Sicherheits‑Layer zunehmend als notwendige Infrastruktur gelten, wenn KI‑Agenten tiefer in geschäftskritische Systeme integriert werden.
arxiv.org
Turning AI Governance Rules into Guardrails for AI Agents - arXiv.org
Comments
0 comments