Die Einschränkungen betreffen nicht nur die Cybersicherheit. Die Sicherheitsleitplanken zielen auch auf Anfragen zu Biologie, Chemie und, was entscheidend ist, auf die Destillation von KI-Modellen. Dieser letzte Punkt hat eine weitere Welle der Kritik ausgelöst, denn einige Entwickler werfen Anthropic vor, den Begriff „Sicherheit" als Vorwand für wettbewerbswidriges Verhalten zu nutzen, indem sie andere KI-Entwickler daran hindern, die Ergebnisse von Fable 5 für das Training ihrer eigenen Modelle zu verwenden .
Das Sicherheitssystem von Fable 5 ist kein simpler Verweigerungsmechanismus. Es ist ein Routing-System, das darauf ausgelegt ist, unbemerkt zu scheitern . Die Architektur funktioniert in drei Schritten:
Anthropic gibt an, dass diese Klassifizierer im Durchschnitt in weniger als 5 % aller Sitzungen ausgelöst werden . Das Unternehmen hat das Problem der übermäßigen Filterung öffentlich eingeräumt. Ein Firmensprecher sagte gegenüber Business Insider, die Sicherheitsmaßnahmen könnten „sichere, neutrale oder harmlose Anfragen kennzeichnen", rechtfertigte dies aber als notwendigen Kompromiss, um ein Modell mit so leistungsfähigen zugrunde liegenden Fähigkeiten öffentlich zugänglich zu machen
.
Anthropics Position ist, dass die konservativen Sicherheitsvorkehrungen eine bewusste und verantwortungsvolle Entscheidung sind, kein Programmierfehler. Das Unternehmen argumentiert, dass das zugrunde liegende Modell der Mythos-Klasse so gut darin ist, Software-Schwachstellen zu finden und auszunutzen, dass eine uneingeschränkte öffentliche Freigabe ein inakzeptables Risiko für katastrophalen Missbrauch darstellen würde .
Die Sicherheitsleitplanken sind in ihren Augen ein Designkompromiss – ein Weg, der Öffentlichkeit Zugang zu einem hochmodernen KI-Modell für logisches Denken, Programmieren und Schreiben zu gewähren, während seine gefährlichsten Fähigkeiten in einer Art Sandbox eingesperrt bleiben . Das übermäßige Filtern sei der vorübergehende Preis für die Veröffentlichung eines leistungsfähigen Modells, das sowohl „sicher als auch schnell" erscheinen soll, verbunden mit dem Versprechen, diese Klassifizierer mit der Zeit zu verfeinern
.
Die Veröffentlichung von Claude Fable 5 kann man nicht isoliert betrachten. Es ist die eine Hälfte einer zweistufigen Bereitstellungsstrategie, die sich zum neuen Industriestandard für KI-Frontiermodelle entwickelt .
Gleichzeitig mit Fable 5 kündigte Anthropic auch Claude Mythos 5 an. Beide Modelle teilen exakt dieselbe Architektur und dieselben Gewichte – sie haben dasselbe „Gehirn". Der einzige Unterschied liegt in der Sicherheitskonfiguration. Bei Mythos 5 wurden die Klassifizierer für die sensiblen Bereiche entfernt, sodass es seine vollen, uneingeschränkten Fähigkeiten entfalten kann .
Allerdings ist Mythos 5 nicht für die Öffentlichkeit bestimmt. Der Zugang ist auf eine kleine Gruppe geprüfter Partner beschränkt, darunter Regierungsbehörden und Betreiber kritischer Infrastrukturen, und läuft über eine Initiative namens Project Glasswing . Dieses von der US-Regierung unterstützte Programm startete zunächst mit 12 Gründungspartnern wie AWS, Google und Microsoft, um „Cyber-Verteidigern" zu ermöglichen, KI für die Suche und Behebung von Software-Schwachstellen in großem Maßstab einzusetzen
. Mit der Veröffentlichung von Mythos 5 wurde der Zugang auf etwa 40 Organisationen ausgeweitet
.
Die folgende Tabelle veranschaulicht die grundlegende Spaltung:
Die Fable/Mythos-Aufteilung von Anthropic ist das deutlichste Beispiel für das, was man als fähigkeitsbasierte, mehrstufige KI-Bereitstellung (Capability-Tiered AI Deployment) bezeichnen kann. In diesem neuen Modell ist eine KI auf dem neuesten Stand der Technik kein einzelnes Produkt mehr. Ihre volle Leistung ist ein Privileg, keine Selbstverständlichkeit, und Sicherheitsleitplanken sind der Mechanismus, der die Produktdifferenzierung schafft .
Dieses Muster ist nicht einzigartig bei Anthropic. Andere führende KI-Unternehmen, darunter OpenAI, haben ähnliche Ansätze verfolgt, indem sie eingeschränkte Versionen ihrer fortschrittlichsten Modelle für Partner aus den Bereichen nationale Sicherheit und Forschung bereitstellen . Der Start von Fable/Mythos verfestigt eine Zukunft, in der die mächtigsten KI-Fähigkeiten nicht durch die Technologie, sondern durch einen Überprüfungsstatus kontrolliert werden, wobei Sicherheitsprotokolle gleichzeitig als Zugangskontrollmechanismen dienen. Dieser Ansatz löst bereits jetzt eine breitere Debatte über Zentralisierung, Fairness und die wahre Bedeutung von „öffentlicher" KI-Sicherheit aus.
Comments
0 comments