答え公開済み2 週間前Last edited 3 日前25 ソース

Neonのレイクベースアーキテクチャの内部：ステートレスコンピュートとセル分離がいかにしてAWS障害を乗り越えるか

Neonは、耐久性のあるデータをローカルディスクに一切持たない「ステートレスPostgresコンピュート」と、障害の影響を1つのセル内に封じ込める「セルベースのリージョン分離」を組み合わせることで、クラウド基盤障害の爆風半径を最小化する[2][7]。このアーキテクチャの耐障害性は、①高コストなホットスタンバイやクラッシュリカバリを不要にするステートレスコンピュート、②障害ドメインを限定するセルベースの区画化、③全ティアに標準装備されるゾーン冗長オブジェクトストレージ、④AWSのAPI依存度を下げる事前プロビジョニング、という4本柱に支えられている[2][7][19]。

Studio Global AIで検索して事実確認さらにトレンドページを見る

929K0

Diagram illustrating Neon's lakebase architecture with stateless compute nodes detached from a zone-redundant storage layer, showing cell-based isolation boundaries and pre-allocat — How does Neon's architecture limit the blast radius of cloud infrastructure failures, as demonstrated during the May 8 AWS outage, and whatNeon's lakebase architecture separates ephemeral compute from durable, zone-redundant storage, with cell-based isolation that bounds the impact of cloud infrastructure failures.
AI プロンプト
Create a landscape editorial hero image for this Studio Global article: How does Neon's architecture limit the blast radius of cloud infrastructure failures, as demonstrated during the May 8 AWS outage, and what. Article summary: Neon’s lakebase architecture limits the blast radius of cloud infrastructure failures through **stateless compute, cell-based regional isolation, zone-redundant storage, and a significantly reduced dependency on cloud pr. Topic tags: general, general web, user generated, documentation. Reference image context from search candidates: Reference image 1: visual subject "It is whether healthcare organizations are architected to remain reliable when a major cloud provider experiences a sudden, widespread failure." source context "The Blast Radius Problem: What the 2025 AWS Outage Reveals About Healthcare’s Cloud Fragility - MedCity News" Reference image 2: visual sub
openai.com

大手クラウドプロバイダのリージョン制御プレーンで障害が発生すると、通常、マネージドデータベースサービスは広範囲にわたって利用不能に陥る。新しいインスタンスの起動、IPアドレスの割り当て、フェイルオーバー機構が、同じダウンしたAPIに依存するからだ。Neonの「レイクベース（湖底）アーキテクチャ」は、まさにこの依存連鎖を断ち切るためにゼロから設計された。クラウドをリアルタイムのリソースオーケストレーターとして扱うのではなく、Neonはキャパシティを事前に割り当て、障害ドメインを隔離する。これにより、AWSのリージョン障害が、そのままNeonのリージョン障害になることを防いでいる。

本稿では、ステートレスコンピュート、セルベースの分離、ゾーン冗長ストレージ、制御プレーン結合度の低減といった、Neonが採用する具体的なアーキテクチャ上の仕組みを解説する。Neonが公開したインシデントレビュー、アーキテクチャ文書、第三者による分析を基に、2026年5月にAWSのus-east-1で発生した障害下でこれらの戦略がどう機能したのか、そしてその結果が、この設計の実環境におけるレジリエンスについて何を物語るのかを紐解く。

核心的洞察：コンピュートの耐久性を可用性から切り離す

Neonのアーキテクチャは、一言で言えば「Postgresを動作させるコンピュートノード上に、耐久性のある状態を一切置かない」という原則から出発する。これは言うは易く、安全に実行するのは極めて難しい。従来型のマネージドPostgresでは、データベースプロセスはローカルにアタッチされたブロックボリュームにデータを書き込む。インスタンスや基盤ハードウェアに障害が起きた場合、状態を複製したホットスタンバイを用意するか、故障したノードのストレージからWAL（Write-Ahead Log、先行書き込みログ）を再生するクラッシュリカバリが必要になる。どちらの道も、代替インスタンスのプロビジョニングやボリュームの付け替えといった、障害時にこそ不安定になるクラウドプロバイダのAPI機能に依存している。

Neonは、この依存を根本から取り除く。すべての耐久データを、コンピュートとは完全に分離されたゾーン冗長ストレージ層に置くのだ。NeonのPostgresコンピュートノードは、ローカルディスクには一切データを保持しない。クエリを処理し、WALレコードを「Safekeeper」と「Pageserver」と呼ばれる専用ノード群へストリーミングするだけである。このノード群が全ての変更を堅牢に保存する。つまり、コンピュートノードの障害はクエリ処理を一瞬停止させるが、データは決して失われない。新しいコンピュートインスタンスは、同じストレージの履歴にアタッチし、前のインスタンスが中断したところから再開できる。ボリュームの再接続やクラッシュリカバリの完了を待つ必要はないのだ。

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Studio Global AIで検索して事実確認

人々も尋ねます