Databricks ha lanciato AI Runtime, un layer di calcolo serverless che fornisce accesso on-demand a GPU NVIDIA A10 e H100 per l'addestramento e l'ottimizzazione di modelli di deep learning, senza il sovraccarico della gestione dell'infrastruttura . Il supporto per l'addestramento distribuito multi-nodo e multi-GPU è in versione beta, e il servizio è progettato per applicazioni di visione artificiale, LLM e sistemi di raccomandazione basati su deep learning
.
L'accelerazione GPU NVIDIA è ora disponibile anche nel tier gratuito di Databricks, abbassando la barriera per gli sviluppatori che vogliono sperimentare con gli agenti AI .
La collaborazione estesa include un miglioramento del model serving per carichi di lavoro agentici e il pieno supporto per lo stack software orientato agli agenti di NVIDIA (ad esempio, NVIDIA Agent Toolkit, microservizi NIM) che opera su dati aziendali governati all'interno del lakehouse di Databricks .
Il calcolo accelerato di NVIDIA è integrato in Databricks Photon, il motore SQL ad alte prestazioni, per velocizzare la pre-elaborazione dei dati e l'ETL per le pipeline AI . L'amministratore delegato di NVIDIA, Jensen Huang, ha sottolineato che ci sono voluti cinque anni per costruire le librerie che rendono possibile questa accelerazione
.
La partnership è esplicitamente inquadrata nel passaggio da modelli AI statici ad agenti AI autonomi e multi-step, che richiedono uno stretto accoppiamento tra dati, calcolo e orchestrazione. Un report di Databricks rivela un aumento del 327% nell'adozione di sistemi AI autonomi in vista del 2026 .
NVIDIA e Databricks scommettono che le performance degli agenti AI sono ormai limitate dalla CPU host (che esegue i loop di pianificazione, chiamata a strumenti e memoria) e non solo dalla potenza della GPU. La CPU Vera è progettata per colmare questo divario .
Una tendenza fondamentale è che gli agenti devono operare su dati aziendali di alta qualità e governati. La partnership enfatizza l'integrazione dell'accelerazione NVIDIA nel lakehouse governato da Unity Catalog di Databricks, in modo che gli agenti ragionino su dati affidabili piuttosto che su fonti isolate o non governate .
Databricks sta anche investendo in protocolli aperti (OpenSharing per le competenze degli agenti) e strumenti per la creazione di agenti (Agent Bricks, Lakebase per la memoria degli agenti) . Allo stesso tempo, NVIDIA sta espandendo le sue partnership per le AI Factory con HPE e altri, posizionando questa collaborazione all'interno di una spinta industriale più ampia verso un'infrastruttura per agenti standardizzata e di livello produttivo.
In sintesi, la partnership copre l'intero ciclo di vita dell'agente, dalla formazione e ottimizzazione su GPU NVIDIA serverless all'inferenza e orchestrazione su CPU NVIDIA Vera, il tutto ancorato al lakehouse di Databricks per la governance dei dati.
Comments
0 comments