Tính đến thời điểm có những báo cáo mới nhất, OpenAI vẫn chưa công bố bất kỳ bản phân tích sự cố (post-mortem) hay giải thích chi tiết nào về nguyên nhân gốc rễ của đợt ngừng hoạt động này . Công ty chỉ thừa nhận sự gián đoạn trên trang trạng thái nhưng không đưa ra mốc thời gian khôi phục hay bất kỳ lý giải kỹ thuật nào
.
Quy mô của sự cố chính là đầu mối quan trọng nhất. Sáu dịch vụ có kiến trúc khác biệt—bao gồm suy luận, tạo hình ảnh và video, thực thi mã, và quản lý danh tính—cùng gặp sự cố trong cùng một thời điểm là dấu hiệu mạnh mẽ cho thấy có sự đổ vỡ ở một lớp nền tảng dùng chung. Các nhà phân tích nghi ngờ về một lỗi tiềm ẩn ở cổng API (API Gateway) lõi, hệ thống điều phối chính (orchestration backbone), hoặc nhà cung cấp xác thực tập trung, thay vì chỉ là vấn đề ở một mô hình biệt lập . Tuy nhiên, nếu không có xác nhận chính thức, đây vẫn chỉ là những suy đoán có cơ sở.
Sự cố đã tạo ra một làn sóng báo cáo khổng lồ từ người dùng. Trên toàn cầu, Downdetector đã nhận được hơn 5.000 khiếu nại, trong đó có hơn 4.300 khiếu nại đến từ Hoa Kỳ . Người dùng trên tất cả các nền tảng—trình duyệt web, ứng dụng di động và máy tính—đều báo cáo rằng họ bị khóa hoàn toàn khỏi hệ thống
.
Ấn Độ là một trong những khu vực bị ảnh hưởng nặng nề nhất. Đất nước này có một trong những cơ sở người dùng ChatGPT lớn nhất thế giới và số lượng báo cáo sự cố từ đây là rất đáng kể . Mặc dù số liệu chính xác, chi tiết từ Downdetector cho riêng Ấn Độ vào ngày cụ thể này không có sẵn tại thời điểm đưa tin, nhưng các mô hình lịch sử cho thấy những đợt ngừng hoạt động lớn của OpenAI thường tạo ra từ 500 đến hơn 900 khiếu nại từ Ấn Độ, và sự cố lần này được mô tả là 'quy mô lớn trên toàn cầu, bao gồm cả Ấn Độ'
.
Ngoài ảnh hưởng đến người dùng cá nhân, sự cố này đã khiến các khách hàng doanh nghiệp sử dụng API 'mất phương hướng' vì thiếu hướng dẫn cụ thể. Các nhà phát triển đang vận hành khối lượng công việc sản xuất (production workloads) trên hạ tầng của OpenAI không nhận được bất kỳ thông tin chính thức nào về nguyên nhân gốc rễ, đánh giá tác động hay thời gian dự kiến khôi phục từ công ty . Trong bối cảnh không có một SLA (Thỏa thuận mức độ dịch vụ - cam kết chính thức về thời gian hoạt động) được công bố, điều mà OpenAI đến nay vẫn chưa cung cấp, các nhà quản trị rủi ro doanh nghiệp buộc phải tự đưa ra các quyết định về hạ tầng mà không có những phân tích sự cố cần thiết để đánh giá khả năng tái diễn
.
Sự cố ngày 29 tháng 5 không phải là hiện tượng đơn lẻ. Đây là hồi chuông báo động mới nhất trong chuỗi các sự cố năm 2026, đang dần bào mòn niềm tin của người dùng và doanh nghiệp:
'Vết xe đổ' này đã định hình nên một khoảng cách đáng kể về độ tin cậy. Một báo cáo của Nordic APIs về độ tin cậy từ cuối năm 2025 đến đầu năm 2026 đã xếp hạng các API AI và Học máy ở vị trí cuối cùng trong tất cả các hạng mục về thời gian hoạt động. Riêng OpenAI đã ghi nhận 11 sự cố riêng biệt trong tháng 1 năm 2026—tương đương với khoảng 2,5 ngày một lần . Trong khoảng thời gian 12 tháng, cả OpenAI và Anthropic đều chật vật để duy trì mức sẵn sàng 99%, một tiêu chuẩn mà nếu đạt được vẫn đồng nghĩa với hơn ba ngày rưỡi 'chết máy' mỗi năm, so với mức trung bình khoảng 99,97% của các nhà cung cấp đám mây lớn
.
Vấn đề về độ tin cậy đang trở nên nghiêm trọng vào đúng thời điểm tồi tệ nhất đối với OpenAI. Công ty gần đây đã không đạt được các mục tiêu về người dùng mới và doanh thu, và mức lỗ dự kiến sẽ lên tới 17 tỷ đô la vào cuối năm nay . Mặc dù sở hữu lượng người dùng cá nhân 'ăn đứt' Anthropic, doanh thu thường niên của Anthropic vào tháng 4 năm 2026 đạt xấp xỉ 30 tỷ đô la, vượt qua con số khoảng 25 tỷ đô la của OpenAI tính đến tháng 2 năm 2026
. Gemini của Google cũng đang đạt được sức hút lớn trong khối doanh nghiệp, khiến cuộc chơi ngày càng chật chội hơn
.
Anthropic cũng có những vấn đề nghiêm trọng về độ tin cậy của riêng mình, bao gồm một sự cố ngừng hoạt động của Claude kéo dài mười giờ vào tháng 4 năm 2026, sau đó là một sự cố khác chỉ vài ngày sau đó . Nhưng sự cố ngày 29 tháng 5 của OpenAI có quy mô toàn diện hơn—một sự sụp đổ đồng thời của mọi dịch vụ—và việc dai dẳng thiếu một SLA công khai đang ngày càng bị coi là yếu tố khác biệt quan trọng đối với những người mua doanh nghiệp e ngại rủi ro
. Các phân tích trong ngành hiện đang tích cực khuyến nghị chiến lược sử dụng định tuyến đa nhà cung cấp (multi-provider routing) với cơ chế chuyển đổi dự phòng (failover) được ghi nhận là tư thế 'phòng thủ' hợp lý cho năm 2026, thay vì dựa dẫm vào bất kỳ nhà cung cấp API AI duy nhất nào
.
Một số câu hỏi lớn vẫn chưa có lời giải đáp sau sự cố ngày 29 tháng 5:
Cho đến khi OpenAI công bố một bản phân tích chi tiết, sự cố ngày 29 tháng 5 sẽ vẫn là một dấu hiệu cảnh báo cho bất kỳ tổ chức nào đang xây dựng các quy trình làm việc quan trọng trên hạ tầng của công ty này.
Comments
0 comments