La pérdida de energía no afectó solo a uno o dos servicios. Microsoft informó de una degradación amplia a nivel regional que impactó una parte significativa de su portafolio. El historial de estado oficial enumeró los siguientes servicios afectados :
Un punto crítico a aclarar es que, a diferencia de algunos infames apagones en centros de datos, no hay evidencia en las fuentes disponibles de que los sistemas de energía de respaldo fallaran en este evento. Las actualizaciones de estado de Microsoft indicaron explícitamente que "la energía del centro de datos se ha restablecido por completo", lo que sugiere que la pérdida inicial del suministro eléctrico fue el problema, no un fallo posterior de los generadores in situ o de los Sistemas de Alimentación Ininterrumpida (SAI o UPS, por sus siglas en inglés). La degradación del servicio fue el resultado del corte de energía inicial y del tiempo necesario para reactivar infraestructuras complejas de almacenamiento y red de forma segura y fiable.
Esto contrasta con otros incidentes documentados de Azure. Por ejemplo, durante una caída en la región West US en febrero de 2026, un fallo en un transformador de voltaje causó una subida de tensión rápida que se propagó y dañó las unidades SAI, lo que provocó una pérdida total de energía. No se ha reportado ningún fallo de hardware interno similar para el evento del 29 de mayo.
La recuperación de una pérdida de energía a nivel regional es una maratón, no un sprint. Basándonos en las actualizaciones oficiales del estado de Azure, esta es la línea de tiempo de los eventos clave:
Esta última caída está lejos de ser un incidente aislado. Es parte de un patrón preocupante de vulnerabilidades relacionadas con el clima que han afectado a la plataforma Azure de Microsoft durante años. Estos incidentes demuestran que incluso la infraestructura de nube más sofisticada está, en última instancia, a merced de la realidad física.
Estos precedentes comparten un hilo conductor con el evento del 29 de mayo: un evento físico externo impacta directamente en la cadena de suministro eléctrico del centro de datos, lo que provoca un fallo en cascada de los servicios digitales que dependen de él.
La inclusión del servicio Azure OpenAI en la lista de servicios degradados marca una escalada notable en el impacto de estas caídas . A medida que las empresas integran cada vez más modelos de IA en flujos de trabajo críticos y productos orientados al cliente, el tiempo de inactividad de la nube regional ya no es solo un inconveniente de infraestructura. Interrumpe directamente las aplicaciones, búsquedas y automatizaciones impulsadas por IA. Si bien una tormenta eléctrica severa es un acto de la naturaleza, la caída resultante pone de relieve un creciente riesgo de concentración para las cargas de trabajo de IA que dependen de regiones de nube específicas.
Microsoft aún no había publicado un Análisis de Causa Raíz (RCA, por sus siglas en inglés) detallado para este incidente específico dentro del periodo de las fuentes proporcionadas. Por lo tanto, las conclusiones finales sobre la secuencia precisa del restablecimiento de la energía y por qué ciertos sellos de almacenamiento requirieron un tiempo de recuperación prolongado solo se confirmarán con una revisión oficial posterior al incidente.
Comments
0 comments