Lần ngừng hoạt động đầu tiên của mainnet bắt đầu vào ngày 28 tháng 5, kéo dài khoảng 6 giờ 44 phút . Một lỗi crash trong logic tính phí gas — cụ thể là ở cách mã 'address-balances' mới xử lý "gas smashing" (quá trình kết hợp các đồng coin đầu vào để trả phí giao dịch) — đã khiến tất cả các trình xác nhận (validator) rơi vào một vòng lặp crash liên tục
. Việc tạo khối (block) dừng hoàn toàn. Khoảng 1 tỷ USD tài sản trên chuỗi đã bị đóng băng tạm thời
.
Các kỹ sư đã xác định lỗi và triển khai một tệp nhị phân đã vá. Khi hơn hai phần ba tổng giá trị cổ phần (staked value) nâng cấp, mạng lưới đã hoạt động trở lại . Tuy nhiên, chính nguyên nhân gốc rễ đó đã kích hoạt lần ngừng hoạt động thứ hai vào cuối ngày hôm đó
. Bản sửa lỗi tạm thời được thiết kế để khôi phục nhanh, không phải để hoàn chỉnh, và rủi ro đã biết đã thành hiện thực
.
Vào ngày 29 tháng 5, sau khi một bản sửa lỗi ổn định hơn cho vấn đề tính phí gas được triển khai và các validator khởi động lại, một lỗi tiềm ẩn riêng biệt lại xuất hiện. Các validator đã thất bại trong việc bảo toàn chính xác trạng thái ngẫu nhiên qua các lần khởi động lại, gây ra một sự cố ngừng đồng thuận mới kéo dài hơn ba tiếng rưỡi . Đội ngũ sau đó đã phát triển và triển khai bản vá thứ hai nhắm cụ thể vào vấn đề bảo toàn trạng thái này. Các validator đã được nâng cấp lại trong suốt các ngày 29–30 tháng 5 cho đến khi đầy đủ sự tham gia được khôi phục
.
Quá trình khôi phục là một nỗ lực lặp đi lặp lại, chạy đua khắc phục qua ba lỗi riêng biệt:
Trong suốt sự cố, Sui Foundation nhấn mạnh rằng không có tiền của người dùng nào gặp rủi ro, không có giao dịch nào đã cam kết bị đảo ngược, và các cơ chế bảo mật ví vẫn hoạt động .
Các sự cố ngừng hoạt động đã có tác động tức thì và có thể đo lường được lên token SUI và tâm lý thị trường:
Trong bản post-mortem và các thông báo tiếp theo, Quỹ đã vạch ra một số biện pháp cụ thể để ngăn chặn các sự cố tương tự :
Bản post-mortem của Sui Foundation thẳng thắn một cách khác thường. Bằng cách thừa nhận đã cố tình triển khai một bản vá tạm thời có rủi ro, Quỹ đã phơi bày một căng thẳng quen thuộc với nhiều đội ngũ kỹ thuật trong môi trường rủi ro cao: áp lực phải khôi phục dịch vụ nhanh chóng so với kỷ luật đảm bảo một bản sửa lỗi hoàn chỉnh . Đối với một blockchain định vị mình cho mục đích sử dụng cấp tổ chức, sự cố này làm dấy lên những câu hỏi chính đáng về quản trị nâng cấp, mức độ nghiêm ngặt trong kiểm thử, và liệu vị thế về độ tin cậy của mạng lưới có tương xứng với tham vọng của nó hay không
.
Các biện pháp bảo vệ đã công bố mới chỉ là sự khởi đầu, nhưng hiệu quả của chúng chỉ thực sự rõ ràng vào lần tới khi Sui đối mặt với một đợt nâng cấp phức tạp dưới ánh đèn sân khấu của công chúng.
Comments
0 comments