Max Schoening, director de producto de Notion, confirmó que el acceso a los modelos de Anthropic se restauró aproximadamente 12 horas después del inicio de la interrupción. Describió el evento como una interrupción temporal del servicio estándar, señalando que este tipo de incidentes le ocurren a cualquier plataforma importante, incluido el propio Notion, GitHub y AWS .
Un portavoz de Anthropic atribuyó el problema a "un breve problema de infraestructura" que causó errores elevados en múltiples modelos de Claude durante un corto período, confirmando que el problema estaba resuelto .
Notion no detalló públicamente qué proveedores de IA alternativos absorbieron el tráfico redirigido, pero la acción de la compañía fue clara: en el momento en que los modelos Opus de Anthropic comenzaron a devolver resultados degradados, el sistema de Notion eliminó automáticamente todos los modelos de Anthropic del selector de modelos orientado al usuario y redirigió las solicitudes a otros lugares .
Este es un ejemplo concreto de una arquitectura de conmutación por error multi-modelo en acción. En lugar de permitir que los fallos visibles para el usuario se propagaran en cascada mientras esperaban la recuperación de Anthropic, Notion trató la capa del modelo de IA como un componente intercambiable, de la misma manera que un arquitecto de la nube trataría una base de datos que falla o una red de distribución de contenido (CDN) que no responde.
La interrupción del 7 de junio fue menor de forma aislada, pero se sitúa en medio de un cúmulo de incidentes de Claude que han sacudido la confianza en la fiabilidad de la plataforma.
La interrupción más significativa ocurrió el 2 de junio, cuando una gran caída afectó a Claude.ai, la API, la Consola de Claude y Claude Code. Se reportaron tasas de error elevadas en Opus 4.6 y otros modelos. Los informes de usuarios en Downdetector se dispararon alrededor de las 02:10 ET / 07:10 GMT. La interrupción total duró casi seis horas antes de que los servicios se restauraran por completo .
Apenas tres días después, el 5 de junio, la plataforma Claude de Anthropic volvió a desconectarse. La página de estado registró "errores elevados en muchos modelos de Claude" desde las 15:08 UTC hasta las 18:28 UTC, siendo Opus 4.7 y 4.8 los últimos en recuperarse. El incidente tomó un cariz más serio cuando los usuarios reportaron haber recibido respuestas después de la caída que parecían pertenecer a otras sesiones, lo que llevó a Anthropic a abrir una investigación formal sobre una posible fuga de datos .
Un incidente más breve el 6 de junio afectó a claude.ai, la consola y la API. Opus 4.8 experimentó un servicio degradado durante aproximadamente 50 minutos antes de que se implementara una solución y se monitorizara .
Este último cúmulo de fallos no surgió de la nada. Opus 4.7 ya había registrado ventanas de errores elevados el 22 y 25 de mayo, y se documentó una regresión de calidad por parte de los desarrolladores aproximadamente una semana después de su lanzamiento el 16 de abril, un patrón que refleja los problemas con Opus 4.6 en marzo .
En abril de 2026, Anthropic reconoció públicamente una disminución de la calidad en Claude Code, Claude Agent SDK y Claude Cowork entre el 4 de marzo y el 20 de abril, atribuyéndola a tres causas distintas y restableciendo posteriormente las restricciones de usuario tras el análisis post mortem .
Para las empresas que dependen de Claude como parte central de su producto, el incidente de Notion del 7 de junio conlleva una lección muy clara: la dependencia de modelos de IA de terceros es ahora un riesgo de infraestructura, y debe ser mitigada mediante ingeniería.
Un sistema en producción que llama a un único modelo de Anthropic necesita tres capacidades distintas: una estrategia de reintento para errores transitorios 5xx o 529, un modelo de respaldo para absorber las interrupciones del servicio y un plan de migración para regresiones de calidad a largo plazo o descontinuaciones de modelos. Confiar únicamente en una de esas estrategias es insuficiente .
La desactivación automática de todos los modelos de Anthropic por parte de Notion y su redireccionamiento sin problemas a proveedores alternativos es exactamente el patrón que más integradores necesitarán adoptar. Sin una conmutación por error multi-modelo, incluso una ventana de rendimiento degradado de 50 minutos puede convertirse en una cascada de fallos para el cliente en bots de soporte, canales de datos y herramientas de velocidad de desarrollo .
Las propias cifras de tiempo de actividad de Anthropic en los últimos 90 días muestran un 98,8% para claude.ai y un 99,15% para la API de Claude . Aunque esos números parecen razonables en términos absolutos, reflejan una plataforma que muchas empresas ahora tratan como infraestructura de nivel 1. La agrupación de incidentes a principios de junio de 2026 —una caída global de seis horas, un apagón de tres horas con investigación de fuga de datos y múltiples interrupciones menores— sugiere que el listón de resistencia para las dependencias de IA debe establecerse más alto que para los servicios SaaS tradicionales.
La decisión de Notion de retirar todos los modelos de Anthropic el 7 de junio fue una respuesta operativa rutinaria a un problema temporal de infraestructura. Pero en el contexto de seis interrupciones notables de Claude en aproximadamente seis semanas, también es una señal clara: el período de gracia para tratar la IA generativa como un experimento emocionante ha terminado.
Para cualquier equipo que construya sobre Claude —o sobre cualquier modelo de IA de terceros— la ingeniería de fiabilidad ya no es opcional. La lógica de reintento, los proveedores de respaldo y una ruta de migración de modelos probada son los nuevos requisitos mínimos para mantener un producto con vida cuando los cimientos bajo él comienzan a temblar.
Comments
0 comments