Le déclencheur immédiat des contrôles à l’exportation a été un signalement de jailbreak — une méthode permettant de contourner les garde-fous de sécurité des modèles. Mais les deux parties étaient en profond désaccord sur sa gravité.
Le désaccord s’est rapidement intensifié. Selon plusieurs rapports, Amodei a riposté avec vigueur lors d’appels avec des responsables de l’administration, qualifiant les inquiétudes du gouvernement de malentendu, et les négociations ont failli complètement capoter à un moment donné .
La Maison-Blanche a désigné Fable 5 comme un cas test pour ses nouvelles barrières de sécurité décrétées par ordre exécutif sur l’IA, en coordonnant les actions du Département du Commerce, du Trésor et de la Maison-Blanche elle-même . L’administration craignait que les capacités des modèles ne permettent à la Chine d’accéder à des outils de cyber-offensive et à d’autres technologies dangereuses à double usage
.
En quelques jours après la crise des contrôles à l’exportation, la Maison-Blanche et Anthropic sont passées de la confrontation à une négociation structurée . Le 17 avril 2026, Amodei a rencontré des responsables de la Maison-Blanche dans ce qui a été décrit comme des pourparlers de trêve productifs — le premier contact de haut niveau depuis les frictions antérieures entre Anthropic et le Pentagone
.
Les figures clés des discussions de haut niveau qui ont suivi incluent le secrétaire au Commerce américain Howard Lutnick, le directeur de la cybersécurité nationale Sean Cairncross, et le cofondateur d’Anthropic Tom Brown . L’administration a coordonné l’action du Département du Commerce, du Trésor et de la Maison-Blanche pour le cas test de Fable 5
.
Le projet central issu de ces pourparlers est un cadre de conformité unifié pour évaluer la gravité des vulnérabilités de sécurité — en particulier les jailbreaks — dans les modèles d’IA de pointe . Ce cadre est conçu pour créer des références communes permettant de déterminer si un défaut de sécurité justifie une intervention gouvernementale
.
Au cœur de cet effort se trouve un système de notation unifié des jailbreaks. Bien qu’aucune étiquette officielle (par exemple « Critique », « Élevé », « Moyen », « Faible ») ni de grille d’évaluation détaillée n’aient été rendues publiques, le cadre évaluerait les vulnérabilités selon trois critères d’évaluation des risques :
L’objectif du gouvernement est d’utiliser ce système de notation pour établir des seuils de risque clairs et prédéfinis qui détermineraient automatiquement l’imposition de contrôles à l’exportation, l’exigence d’atténuations ou le blocage du déploiement, plutôt que d’agir de manière ponctuelle après une crise .
L’objectif global du gouvernement est de passer d’une intervention réactive dictée par la crise à un système fondé sur des règles . En codéveloppant le cadre de notation et les seuils de risque avec Anthropic, la Maison-Blanche vise à :
Incertitude clé : Aucun critère détaillé, champ d’application ou calendrier pour le cadre n’a été rendu public. Les trois critères d’évaluation des risques (protections contournées, capacités exposées, impact réel) ont été rapportés par plusieurs médias, mais la méthodologie de notation spécifique n’a pas été divulguée .
Le développement du cadre américano-Anthropic s’inscrit dans le contexte des discussions du G7 sur les normes de sécurité de l’IA. Le G7 s’efforce d’établir des références internationales harmonisées pour l’évaluation des risques de l’IA de pointe . Le système de notation unifié que construisent la Maison-Blanche et Anthropic devrait alimenter — et être alimenté par — ces discussions multilatérales plus larges, bien que les résultats spécifiques du G7 restent en cours de négociation
.
Le développement de ce cadre marque un tournant significatif dans la politique américaine en matière d’IA. Quelques jours seulement avant les contrôles à l’exportation, Amodei avait publié un essai politique arguant que les gouvernements devraient détenir une autorité légale obligatoire pour bloquer ou inverser le déploiement de modèles d’IA de pointe qui échoueraient aux tests de sécurité indépendants . La crise du 12 juin a soumis ce principe à une épreuve de confrontation inattendue.
La question clé qui reste ouverte : comment définir la ligne de démarcation entre une vulnérabilité étroite et gérable et un risque systémique justifiant une intervention gouvernementale. La réponse façonnera non seulement les futures versions d’Anthropic, mais aussi le paysage réglementaire plus large du développement de l’IA de pointe.
Comments
0 comments