이 LTAP의 기반이 되는 것은 Databricks의 서버리스 Postgres 서비스인 Lakebase다. 이미 수천 명의 고객을 보유하고 있으며 플랫폼 전반에서 하루 1,200만 건의 데이터베이스 실행을 처리하고 있다 . LTAP 모델 하에서 Lakebase는 데이터를 Unity Catalog에 개방형 포맷(Delta Lake 및 Apache Iceberg)으로 직접 저장한다. 이를 통해 엄격한 거버넌스가 적용된 트랜잭션 데이터를 분석 워크로드가 즉시 쿼리할 수 있게 된다
.
이 아키텍처의 주요 특징으로는 단일 소스 기반의 통합된 거버넌스, 트랜잭션 및 분석 워크로드의 독립적인 확장, Postgres 워크로드에 대한 완전한 ACID 지원, 그리고 유지 관리가 필요한 숨겨진 파이프라인이나 커넥터의 부재를 들 수 있다 .
LTAP 발표와 함께 Databricks는 Lakebase 자체의 여러 개선 사항도 선보였다.
이러한 기능들은 Lakebase가 단순한 분석 편의 계층이 아닌, 애플리케이션과 AI 에이전트를 위한 ‘퍼스트 클래스’ 운영 데이터베이스로 자리매김하려는 Databricks의 의지를 보여준다.
두 번째 주요 인프라 발표는 레이크하우스//RT(Lakehouse//RT) 였다. 이는 레이든(Reyden) 이라는 새로운 컴퓨트 엔진으로 구동되는 실시간 레이크하우스다. ‘Reyden’이라는 이름은 공동 창립자 Reynold Xin의 이름을 딴 ‘Reynold’s Dream Engine’의 약자다 .
Databricks는 Reyden이 거버넌스가 적용된 Delta Lake 및 Apache Iceberg 테이블 위에서 직접 수만 명의 동시 사용자와 에이전트에게 밀리초 단위의 쿼리 지연 시간을 제공한다고 밝혔다 .
이 발표의 의미는 상당하다. 기업은 더 이상 실시간 성능을 확보하기 위해 캐싱 레이어, 구체화된 뷰(Materialized Views), 외부 쿼리 엔진과 같은 별도의 서빙 인프라를 구축할 필요가 없어지는 것이다. BI 도구인 Sigma Computing이 이 파트너로 참여하여 임베디드 분석을 위해 레이크하우스//RT에 직접 연결된다 .
Databricks는 이번 서밋을 자사 플랫폼을 기업용 AI 에이전트의 기반으로 자리매김하는 데 활용했다. 관련 주요 발표는 다음과 같다.
업계 분석가들이 포착한 더 큰 그림은, LTAP와 레이크하우스//RT가 에이전트 중심 기업 아키텍처의 하부 데이터 서빙 계층이라는 점이다. Databricks는 운영 데이터를 개방형 포맷으로 거버넌스 스토리지에 배치함으로써, AI 에이전트가 데이터를 이동하거나 복사하지 않고도 프로덕션 데이터베이스에 접근하고, 이를 추론하며, 행동할 수 있다고 믿는다 .
Databricks는 Azure 에코시스템과의 통합도 한층 강화했다. 공동 발표된 주요 기능은 다음과 같다.
이러한 통합은 비즈니스 의사 결정이 일어나는 협업 도구 안에 Databricks의 거버넌스 및 AI 기능을 내재화하려는 전략을 시사한다. 사용자가 별도의 분석 인터페이스로 이동할 필요 없이, 익숙한 도구에서 데이터의 가치를 바로 활용하게 하려는 것이다.
종합적으로, 이번 서밋 발표는 차세대 기업 애플리케이션은 에이전트 중심적이고, 실시간이며, 엄격하게 관리될 것이라는 일관된 플랫폼 전략을 보여준다. LTAP는 트랜잭션과 분석의 경계를 없애고, 레이크하우스//RT는 분석 쿼리의 지연 시간 문제를 해결하며, Genie 제품군은 그 위에서 에이전트를 조율하는 계층을 제공한다.
만약 이 전략이 성공한다면, 이 아키텍처는 일반적인 기업 데이터 스택의 복잡성을 획기적으로 줄일 수 있다. 더 적은 데이터베이스, 더 적은 파이프라인, 더 적은 서빙 레이어만으로도 AI 에이전트가 비즈니스 데이터를 바탕으로 자율적으로 행동하는 데 필요한, 거버넌스가 적용된 실시간 컨텍스트를 제공할 수 있게 되는 것이다.
데이터 관리의 융합을 추구하는 것은 Databricks만이 아니다. 하지만 이미 하루 1,200만 건의 Lakebase 데이터베이스 실행과 30,000명 이상의 현장 참석자를 동원한 이번 서밋의 규모를 고려할 때 , 이번 LTAP 발표는 레이크하우스 아키텍처가 단순한 분석 플랫폼에서 운영 데이터의 중추로 진화하는 중요한 이정표로 기록될 전망이다.
Comments
0 comments