El detonante inmediato de los controles de exportación fue un supuesto jailbreak, un método para eludir las salvaguardas de seguridad de los modelos. Sin embargo, ambas partes discreparon fuertemente sobre su gravedad.
El desacuerdo escaló rápidamente. Según múltiples informes, Amodei se opuso firmemente en llamadas con funcionarios de la administración, describiendo las preocupaciones del gobierno como un malentendido, y en un momento las negociaciones casi se rompieron por completo .
La Casa Blanca designó a Fable 5 como un caso de prueba para sus nuevas directrices de la orden ejecutiva de IA, coordinando entre el Departamento de Comercio, el Tesoro y la propia Casa Blanca . La administración temía que las capacidades de los modelos pudieran permitir el acceso chino a herramientas de ciberseguridad ofensivas y otras tecnologías peligrosas de doble uso
.
En cuestión de días después de la crisis de control de exportaciones, la Casa Blanca y Anthropic pasaron del enfrentamiento a la negociación estructurada . El 17 de abril de 2026, Amodei se reunió con funcionarios de la Casa Blanca en lo que se describió como conversaciones de tregua productivas — el primer contacto de alto nivel desde la fricción anterior entre Anthropic y el Pentágono
.
Las figuras clave en las subsiguientes discusiones de alto nivel incluyen al Secretario de Comercio de EE.UU., Howard Lutnick; al Director Nacional de Ciberseguridad, Sean Cairncross; y al cofundador de Anthropic, Tom Brown . La administración ha coordinado entre el Departamento de Comercio, el Tesoro y la Casa Blanca para el caso de prueba de Fable 5
.
El proyecto central que ha surgido de estas conversaciones es un marco de cumplimiento unificado para evaluar la gravedad de las vulnerabilidades de seguridad — particularmente los jailbreaks — en los modelos de IA de frontera . El marco está diseñado para crear puntos de referencia comunes para evaluar si un fallo de seguridad justifica la intervención del gobierno
.
En el centro del esfuerzo hay un sistema de calificación unificado para jailbreaks. Aunque no se han publicado etiquetas oficiales (por ejemplo, "Crítico", "Alto", "Medio", "Bajo") ni una rúbrica detallada, el marco evalúa las vulnerabilidades según tres criterios de evaluación de riesgos :
El objetivo del gobierno es utilizar este sistema de calificación para establecer umbrales de riesgo claros y predefinidos que determinen automáticamente si se deben imponer controles de exportación, requerir mitigaciones o bloquear el despliegue, en lugar de actuar de forma ad hoc después de una crisis .
El objetivo general del gobierno es pasar de una intervención reactiva e impulsada por crisis a un sistema basado en reglas . Al co-desarrollar el marco de calificación y los umbrales de riesgo con Anthropic, la Casa Blanca busca:
Incertidumbre clave: No se han publicado criterios detallados, alcance ni cronograma para el marco. Los tres criterios de evaluación de riesgos (protecciones eludidas, capacidades expuestas, impacto en el mundo real) han sido reportados por múltiples medios, pero la metodología de puntuación específica no se ha dado a conocer .
El desarrollo del marco entre EE.UU. y Anthropic se da en el contexto de las discusiones del G7 sobre estándares de seguridad de IA. El G7 ha estado trabajando hacia puntos de referencia internacionales armonizados para evaluar los riesgos de la IA de frontera . Se espera que el sistema de calificación unificado que están construyendo la Casa Blanca y Anthropic informe — y sea informado por — esas conversaciones multilaterales más amplias, aunque los resultados específicos del G7 aún están en negociación
.
El desarrollo del marco marca un giro significativo en la política de IA de EE.UU. Solo unos días antes de los controles de exportación, Amodei había publicado un ensayo político argumentando que los gobiernos deberían tener la autoridad legal obligatoria para bloquear o revertir el despliegue de modelos de IA de frontera que no superen las pruebas de seguridad independientes . La crisis del 12 de junio puso ese principio a prueba de una manera inesperadamente conflictiva.
La pregunta clave que sigue abierta: cómo definir la línea entre una vulnerabilidad estrecha y manejable y un riesgo sistémico que justifique la intervención del gobierno. La respuesta moldeará no solo los futuros lanzamientos de Anthropic, sino también el panorama regulatorio más amplio para el desarrollo de la IA de frontera.
Comments
0 comments