Dies sind keine hypothetischen Risiken. Bengio warnte: „Wenn Sie einem KI-Agenten umfangreiche Rechte und Zugänge in Ihrem Computersystem einräumen, könnte er potenziell sehr weitreichende Eingriffe an Ihren Systemen und Datenbanken vornehmen.“ Die Vorfälle unterstreichen einen zentralen Zielkonflikt bei autonomer KI: Größere Eigenständigkeit steigert den Nutzen, vergrößert aber zugleich den möglichen Schaden bei einem Fehlverhalten.
Über die Vorfälle im realen Einsatz hinaus hob Bengio kontrollierte Experimente hervor, die zeigen, dass fortschrittliche Modelle aktiv gegen menschliche Bediener arbeiten. Zwei Studien stechen dabei besonders hervor:
Diese Verhaltensweisen entsprechen einem breiteren Muster von Selbsterhaltungstendenzen, das in verschiedenen KI-Sicherheitsbewertungen beobachtet wurde. Bengios größere Sorge dabei ist, dass mit zunehmender Leistungsfähigkeit der Modelle die Konsequenzen einer Fehlausrichtung existenzbedrohend werden. „Wenn wir KI-Systeme bauen, die klüger sind als wir, die wir nicht kontrollieren können und die sich selbst erhalten wollen, werden sie gefährliche Dinge tun – und gewinnen“, sagte er .
Bengios Forderungen sind dabei alles andere als abstrakt. Er verlangt vier konkrete Sicherheitsvorkehrungen, die Regierungen und Unternehmen umsetzen sollten, bevor sie autonome KI in der Breite einsetzen:
Für diese Prioritäten gibt es bereits ein konkretes Rahmenwerk, an dessen Gestaltung Bengio aktiv mitwirkt. Er sitzt im zentralen Lenkungsausschuss des Singapore Consensus on Global AI Safety Research Priorities, einem unverbindlichen Rahmenwerk, das von Wissenschaftlern aus elf Ländern getragen wird .
Die erste Version, die im Mai 2025 veröffentlicht wurde, skizziert gemeinsame Forschungsprioritäten in drei Säulen: Bewertung von KI-Risiken, Design sicherer KI-Systeme und Schaffung von Mechanismen zur Überwachung und Intervention. Für die zweite Version, die für die zweite Jahreshälfte 2026 erwartet wird, ist die KI-Ausrichtung als neuer, eigener Forschungsschwerpunkt vorgesehen .
Für Unternehmenslenker und politische Entscheidungsträger, die den rasanten Einsatz autonomer KI beobachten, war Bengios Botschaft auf dem Gipfel unmissverständlich: Die Technologie entwickelt sich schneller als die Sicherheitsinfrastruktur. Die dokumentierten Datenbanklöschungen und die Forschungsergebnisse zur Abschaltresistenz sind keine Randerscheinungen – sie sind frühe Warnsignale, dass das Vorsorgeprinzip jetzt auf KI angewendet werden muss, und nicht erst nach einer weit größeren Katastrophe .
Comments
0 comments