La métrica interna más impactante es el grado en que la IA ya se ha apoderado del acto físico de programar en Anthropic. Según datos de mayo de 2026, más del 80% de todo el código que se fusiona en la base de código de la compañía es escrito por Claude . Se trata de un salto desde niveles de un solo dígito apenas un año antes, en febrero de 2025
. Anteriormente, el CEO Dario Amodei ya había señalado que más del 90% del código para los nuevos modelos y funciones de Claude era escrito por la IA, y el nuevo informe confirma que este dominio se extiende a toda la base de código fusionada de la empresa
.
Esto no es solo una ganancia de eficiencia; representa un cambio estructural en la cadena de desarrollo. La consecuencia es que los ingenieros de Anthropic ahora producen ocho veces más código por trimestre en comparación con la línea base de 2021 a 2025 . El cuello de botella en la creación de software está pasando de escribir y probar líneas de código a tareas de más alto nivel: definición de objetivos, arquitectura y criterio.
El informe proporciona una cronología de aceleración vertiginosa en varias medidas estándar de competencia en ingeniería e investigación :
Quizás la métrica más impactante para predecir la auto-mejora recursiva es la duración de las tareas autónomas. La investigación de METR rastrea cuánto tiempo puede trabajar una IA de forma independiente con una tasa de éxito del 50%. Este horizonte de tareas se ha ampliado de aproximadamente 30 segundos en 2022 a 12 horas con Claude Opus 4.6 en abril de 2026, un aumento de 1.440 veces . Claude Mythos Preview puede trabajar durante al menos 16 horas, lo que se señala como el límite máximo de lo que METR puede medir actualmente
. La tasa de duplicación de este horizonte se ha acelerado de cada siete meses a cada cuatro meses
.
Los datos cuantitativos sobre código se combinan con encuestas internas sobre productividad humana. Un análisis de 200.000 transcripciones internas de Claude y 53 entrevistas en profundidad descubrió que el 27% de las tareas asistidas por IA eran trabajos que los empleados simplemente no habrían intentado sin la IA, porque el coste en tiempo los hacía inviables . Esto no es automatizar el trabajo existente, sino una expansión de lo que es posible siquiera intentar. En un estudio interno separado de noviembre de 2025, los empleados informaron usar Claude en el 60% de su trabajo y estimaron un aumento de productividad del 50%, frente al 20% del año anterior
.
La postura de Anthropic es explícita. La empresa afirma: "Aún no hemos llegado a ese punto, y la auto-mejora recursiva no es inevitable. Pero podría llegar antes de lo que la mayoría de las instituciones están preparadas" . Sostiene que una capacidad global para pausar o ralentizar el desarrollo de la IA "probablemente sería algo bueno" y está instando directamente a otros laboratorios a considerarlo
.
Esa misma semana, las acciones de OpenAI pintaron un panorama opuesto. El 3 de junio, OpenAI publicó una agenda de políticas pidiendo un marco federal de seguridad para la IA de frontera, con evaluaciones de modelos obligatorias y protecciones para denunciantes, pero con una cláusula crítica: la anulación de las leyes de seguridad a nivel estatal . Pide explícitamente al instituto federal de seguridad CAISI que priorice el monitoreo del progreso hacia la auto-mejora recursiva
. Al mismo tiempo, OpenAI se está dotando de personal para este mismo riesgo, creando un puesto de "Investigador, Preparación para la Auto-Mejora Recursiva" dentro de su equipo de seguridad, con una compensación publicada de entre 295.000 y 445.000 dólares
. El trabajo se enmarca como un problema de contención de pérdida de control, un esfuerzo "estratégico y de buen gusto" para mitigar riesgos que "podrían existir en el futuro, pero quizás no ahora"
.
Ambos laboratorios ven venir la misma ola, pero Anthropic insta a la flota a reducir la velocidad, mientras que OpenAI contrata socorristas y argumenta en contra de que un solo estado pueda prohibir el baño.
El cofundador de Anthropic, Jack Clark, ha estimado por separado una probabilidad del 60% de que este "bucle" se cierre para finales de 2028 . Los datos internos del post del 4 de junio proporcionan el sustento factual de por qué esa estimación no es una hipótesis lejana, sino una proyección de una curva que ya está visiblemente disparada.
Comments
0 comments