LTAPは、これらのワークロードをデータレイクに保存された一つのデータコピー上で統合することを目的としている。Databricksによれば、このアーキテクチャは設計上、ETL、レプリカ、データ移動を排除するという 。トランザクションデータは変換やパイプラインメンテナンスなしに、即座に分析に利用可能となる。
このLTAPの基盤となるのが、オープンなオブジェクトストレージ上に構築されたサーバーレスPostgresサービス「Lakebase」だ 。Lakebaseはすでに数千の顧客に利用され、プラットフォーム全体で1日あたり1200万回のデータベース起動を処理している
。LTAPモデルの下では、LakebaseはデータをDelta LakeやApache IcebergといったオープンフォーマットでUnity Catalogに直接保存する。これにより、ガバナンスの効いたトランザクションデータが、分析ワークロードから即座にクエリ可能になる
。
これらの機能は、DatabricksがサーバーレスPostgresを単なる分析用の簡易レイヤーではなく、アプリケーションやAIエージェントのための第一級の運用データベースにしようとしていることを示している 。
2つ目の主要なインフラ発表は、新しいコンピュートエンジン「Reyden」(共同創業者Reynold Xinにちなむ「Reynold's Dream Engine」の略)を搭載したリアルタイムレイクハウス「Lakehouse//RT」だ 。
Databricksによれば、Reydenはガバナンスの効いたDelta LakeおよびApache Icebergテーブル上で直接、数万の同時接続ユーザーとエージェントに対してミリ秒単位のクエリレイテンシを実現するという 。
これは、リアルタイム性能を達成するために企業がキャッシュ層、マテリアライズドビュー、外部クエリエンジンなどの個別のサービス提供インフラを設定する必要がなくなる可能性を意味する 。ビジネスインテリジェンス(BI)ツールのSigma Computingがローンチパートナーとして参加し、組み込み分析のためにLakehouse//RTに直接接続することを発表した
。
Databricksは今回のサミットを、自社プラットフォームをエンタープライズAIエージェントの基盤と位置付ける場としても活用した。発表内容は以下の通りだ:
業界アナリストが捉えたより大きな文脈は、LTAPとLakehouse//RTが、エージェント型エンタープライズアーキテクチャのデータ提供レイヤーであるということだ。Databricksは、運用データをオープンフォーマットでガバナンスされたストレージ上に置くことで、AIエージェントがデータを移動したりコピーしたりすることなく、本番データベースにアクセスし、推論し、行動できると考えている 。
Databricksは、Microsoft Azureエコシステムとの統合を一層深め、以下の機能を共同発表した:
これらの統合は、ユーザーを別の分析インターフェースに切り替えさせるのではなく、ビジネス判断が行われるコラボレーションツールにDatabricksのガバナンスとAI機能を組み込むという戦略を示唆している。
サミットでの一連の発表は、次世代のエンタープライズアプリケーションがエージェント主体、リアルタイム、かつガバナンスが効いたものになるという、一貫したプラットフォーム戦略を示している。
LTAPはトランザクションと分析の断絶を取り除き、Lakehouse//RTは分析クエリにおける遅延の妥協点を解消する。そしてGenieファミリーがエージェントのオーケストレーションレイヤーを提供する 。
これが成功すれば、データベース、パイプライン、データ提供レイヤーといった、典型的な企業データスタックに存在する多くの可動部品を減らしつつ、AIエージェントが自律的にビジネスデータに基づき行動するために必要な、ガバナンスの効いたリアルタイムなコンテキストを提供できる可能性がある。
Databricksだけがこの収束を追求しているわけではないが、Lakebaseがすでに1日あたり1200万回のデータベース起動を達成し、3万人以上の参加者を集めたサミットがそのエコシステムを強化する中で、LTAPの発表は、レイクハウスアーキテクチャが分析プラットフォームから運用データのバックボーンへと進化する、重要なマイルストーンとなる 。
Comments
0 comments