A Databricks lançou o AI Runtime, uma camada de computação serverless que oferece acesso sob demanda a GPUs NVIDIA A10 e H100 para treinamento e ajuste fino de modelos de deep learning, sem a sobrecarga de gerenciamento de infraestrutura . O treinamento distribuído em vários nós e o suporte a múltiplas GPUs estão em versão beta, e o serviço é projetado para visão computacional, LLMs e sistemas de recomendação baseados em deep learning
.
A aceleração de GPU NVIDIA agora está disponível no nível gratuito da Databricks, reduzindo a barreira para que desenvolvedores experimentem agentes de IA .
A colaboração expandida inclui melhorias no serving de modelos para cargas de trabalho agênticas e suporte total ao stack de software orientado a agentes da NVIDIA (como NVIDIA Agent Toolkit e microserviços NIM) rodando sobre dados empresariais governados dentro do lakehouse da Databricks .
A computação acelerada da NVIDIA é integrada ao Databricks Photon, o mecanismo SQL de alto desempenho, para acelerar o pré-processamento de dados e ETL para pipelines de IA . O CEO da NVIDIA, Jensen Huang, observou que foram necessários cinco anos para construir as bibliotecas que tornam essa aceleração possível
.
A parceria é explicitamente construída em torno da mudança de modelos de IA estáticos para agentes autônomos de múltiplas etapas, que exigem um acoplamento estreito entre dados, computação e orquestração. Um relatório da Databricks revela um aumento de 327% na adoção de sistemas autônomos de IA com vista para 2026 .
NVIDIA e Databricks apostam que o desempenho dos agentes de IA é agora limitado pelo CPU hospedeiro (que executa planejamento, chamadas de ferramentas e loops de memória), e não apenas pela taxa de transferência da GPU. O CPU Vera foi projetado para fechar essa lacuna .
Uma tendência central é que os agentes devem atuar sobre dados empresariais governados e de alta qualidade. A parceria enfatiza levar a aceleração da NVIDIA ao lakehouse governado pelo Unity Catalog da Databricks, para que os agentes raciocinem sobre dados confiáveis, em vez de fontes isoladas ou não governadas .
A Databricks também está investindo em protocolos abertos (OpenSharing para Habilidades de Agentes) e ferramentas de construção de agentes (Agent Bricks, Lakebase para memória de agentes), enquanto a NVIDIA expande simultaneamente suas parcerias de AI Factory com a HPE e outras — posicionando esta colaboração dentro de um impulso mais amplo do setor em direção a uma infraestrutura de agentes padronizada e pronta para produção .
Comments
0 comments