答え公開済み2 か月前Last edited 先月13 ソース

5月19日のRailway障害はなぜ起きたのか：Google Cloudのアカウント制限がプラットフォーム全体を停止させた理由

2026年5月19日22:20〜22:29 UTCごろ、RailwayのGoogle Cloud本番アカウントが「restricted」状態となり、CloudSQLやAPI、overflow VMなどの重要リソースが削除されプラットフォーム全体が停止した。[3] コントロールプレーンがGoogle Cloudのリソースに依存していたため、ルーティング、デプロイ、ダッシュボード、認証など多くの機能が同時に影響を受けた。[2][3] 今回の障害は、マルチクラウド構成でもコントロールプレーンが単一クラウドに依存している場合、全体障害が起き得るという設計上のリスクを示した。[2][3][7]

Studio Global AIで検索して事実確認さらにトレンドページを見る

Illustration of a cloud platform outage caused by a restricted cloud account affecting infrastructure services — What happened during the Railway outage on May 19 when Google Cloud automatically restricted Railway’s production account, how did that suspA Google Cloud account restriction removed key infrastructure used by Railway, triggering a cascading platform outage.
AI プロンプト
Create a landscape editorial hero image for this Studio Global article: What happened during the Railway outage on May 19 when Google Cloud automatically restricted Railway’s production account, how did that susp. Article summary: Railway’s May 19 outage appears to have started when Google Cloud automatically restricted Railway’s production account, cutting Railway off from core Google-hosted infrastructure and triggering a platform-wide failure. . Topic tags: general, general web. Reference image context from search candidates: Reference image 1: visual subject "We recently experienced an outage which affected inbound traffic, on Google Cloud, on all regions of our network. During this outage, inbound requests on Google Cloud Edge servers" source context "Incident Report: December 16th, 2024 - Railway Blog" Reference image 2: visual subject "On Monday, Railway, a provider of cloud infra
openai.com

2026年5月、開発者向けクラウドプラットフォーム Railway で数時間にわたる大規模障害が発生しました。ダッシュボード、API、デプロイ、ホストされているアプリケーションが同時に利用できなくなり、多くの開発者が影響を受けました。

原因として明らかになっているのは、Google CloudがRailwayの本番アカウントを自動的に「restricted（制限）」状態にしたことです。この制限により、重要なインフラリソースへのアクセスが失われました。

サービスは最終的に復旧しましたが、この出来事は「クラウド基盤の依存関係」がどれほど大きな影響を持つかを示す象徴的な例となりました。

障害の発生タイムライン

問題が始まったのは 5月19日 22:20〜22:29 UTCごろ。この時間帯にRailwayのシステムは突然、Google Cloud上の重要なリソースにアクセスできなくなりました。

その直後からユーザー側では次のような問題が発生しました。

ダッシュボードが読み込めない
ログイン認証の失敗
稼働中アプリの "no healthy upstream" エラー

Railwayのエンジニアによる説明では、Google Cloudのアカウントが「restricted」状態に移行し、そのアカウントに紐づく複数のリソースが削除されたとされています。

復旧には数時間を要し、RailwayはGoogle Cloudサポートと協力しながらアカウントのアクセス回復とサービス再構築を進めました。企業向けサポート契約があっても、制限の原因を特定するまでに時間がかかったと報告されています。

なぜ核心サービスが一斉に停止したのか

今回の制限は、Railwayが自社サービス運用に利用していた基盤レベルのコンポーネントに直接影響しました。

削除または停止された主なリソースは以下です。

CloudSQL（プラットフォームのデータベース）
Railway API（内部・外部の中心的サービス）
Overflow VM（追加計算リソース）

特に重要だったのが APIの消失です。Railwayのコントロールプレーンの中心となるサービスであり、これがなくなることで多数の依存サービスが同時に機能停止しました。

その結果、次のような機能が広範囲で影響を受けました。

ダッシュボードとログイン
アプリのデプロイ
アプリケーションのルーティング
新しいワークロードのビルドやプロビジョニング

つまり、開発者向けUIと実際にホストされているアプリの両方が不安定、または完全にアクセス不能になりました。

障害がプラットフォーム全体に広がった理由

問題がさらに深刻化したのは、Railwayのオーケストレーションやルーティング層が、制限されたGoogle Cloudリソースに依存していたためです。

Railwayは復旧作業の中で、ユーザーに アプリを再デプロイすることで正常なマシンへルーティングできる場合があると説明しました。

これは次のことを示唆しています。

ワークロード配置
ルーティング状態
インフラ再構築

といった処理を担うコントロールプレーンが、Google Cloudのリソースなしでは完全に機能しなかった可能性があるということです。

一部コミュニティでは、AWSやRailway自社ハードウェア上のワークロードにも影響が広がった理由として、ルーティング状態の更新ができなかった可能性が指摘されています。ただし、この仕組みの詳細は公式の完全なポストモーテムではまだ確認されていません。

「マルチクラウド」でも安全とは限らない

この障害で最も議論を呼んだのは、マルチクラウド設計の落とし穴です。

RailwayはAWSや専用ハードウェアなど複数の環境でインフラを運用しています。しかし今回のケースでは、コントロールプレーンがGoogle Cloudアカウントに依存していたため、単一の制限イベントが全体停止につながりました。

アカウントへのアクセスを失うと、単なる計算リソースだけでなく次の機能も同時に失われます。

デプロイ情報の管理
ルーティング設定
インフラのプロビジョニング
ワークロード復旧

結果として、マルチクラウドでも実質的な単一障害点（Single Point of Failure）が存在していた形になります。

自動アカウント制限への懸念

今回の出来事は、クラウドプロバイダーが採用している自動アカウント制御システムにも議論を呼びました。

大手クラウドでは次のような理由でアカウントが自動制限されることがあります。

請求トラブル
ポリシー違反
セキュリティ異常

ただし今回のケースでは、Google CloudがなぜRailwayのアカウントを制限したのかは公表されていません。

このため、

自動判定による措置だったのか
誤検知だったのか
何らかの運用問題だったのか

といった点は依然として不明のままです。

まだ分かっていないこと

現時点の公開情報では、いくつかの重要な点が未解決です。

Google Cloudがアカウントを制限した具体的な理由
CloudSQL、API、ルーティング、計算基盤の詳細な依存関係
障害が他クラウド環境に波及した正確な技術的メカニズム

今後、より詳細な技術ポストモーテムが公開されれば全体像が明確になる可能性があります。

クラウド時代のインフラ設計への教訓

この障害が示した最大のポイントは、インフラの多様性よりもコントロールプレーンの依存関係が重要だということです。

複数クラウドにワークロードを分散していても、次の仕組みが単一プロバイダーに依存している場合、全体停止のリスクは残ります。

オーケストレーション
デプロイ管理
ルーティング
認証
データベース

Railwayの5月19日の障害は、現代のクラウドアーキテクチャにおける重要な教訓を改めて示しました。

「マルチクラウド」であることと、「単一障害点がない」ことは同じではないということです。

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Studio Global AIで検索して事実確認

人々も尋ねます