Databricks đã ra mắt AI Runtime – một lớp tính toán không máy chủ (serverless) cung cấp quyền truy cập theo yêu cầu vào các GPU NVIDIA A10 và H100 cho việc huấn luyện và tinh chỉnh các mô hình học sâu mà không cần quản lý hạ tầng . Tính năng huấn luyện phân tán đa nút (multi-node) và hỗ trợ nhiều GPU (multi-GPU) hiện đang trong giai đoạn thử nghiệm beta, và dịch vụ này được thiết kế cho thị giác máy tính, mô hình ngôn ngữ lớn (LLM) và các hệ thống đề xuất dựa trên học sâu
.
Khả năng tăng tốc GPU của NVIDIA hiện đã có sẵn trong gói miễn phí (Free Edition) của Databricks, giúp hạ thấp rào cản cho các nhà phát triển muốn thử nghiệm với các tác nhân AI .
Sự hợp tác mở rộng bao gồm các cải tiến trong việc phục vụ mô hình cho khối lượng công việc tác nhân và hỗ trợ toàn diện cho bộ phần mềm hướng tác nhân của NVIDIA (ví dụ: NVIDIA Agent Toolkit, các microservice NIM) chạy trên dữ liệu doanh nghiệp được quản trị trong lakehouse của Databricks .
Khả năng tính toán tăng tốc của NVIDIA được tích hợp vào Databricks Photon – công cụ SQL hiệu suất cao – nhằm tăng tốc quá trình tiền xử lý dữ liệu và ETL cho các pipeline AI . CEO của NVIDIA, Jensen Huang, cho biết phải mất năm năm để xây dựng các thư viện giúp khả năng tăng tốc này trở nên khả thi
.
Quan hệ đối tác này được xây dựng rõ ràng xung quanh sự chuyển dịch từ các mô hình AI tĩnh sang các tác nhân AI tự động, có khả năng thực hiện các bước đa nhiệm, đòi hỏi sự kết hợp chặt chẽ giữa dữ liệu, tính toán và điều phối. Một báo cáo của Databricks cho thấy mức tăng 327% trong việc áp dụng các hệ thống AI tự động khi bước vào năm 2026 .
NVIDIA và Databricks đang đặt cược rằng hiệu suất của các tác nhân AI hiện bị giới hạn bởi CPU máy chủ (nơi chạy các vòng lặp lập kế hoạch, gọi công cụ và quản lý bộ nhớ) chứ không chỉ đơn thuần là thông lượng GPU. CPU Vera được thiết kế để thu hẹp khoảng cách này .
Một xu hướng cốt lõi là các tác nhân phải hoạt động dựa trên dữ liệu doanh nghiệp chất lượng cao và được quản trị. Sự hợp tác này nhấn mạnh việc mang khả năng tăng tốc của NVIDIA đến lakehouse được quản trị bởi Unity Catalog của Databricks, để các tác nhân có thể suy luận dựa trên dữ liệu đáng tin cậy thay vì các nguồn dữ liệu rời rạc hoặc không được quản lý .
Databricks cũng đang đầu tư vào các giao thức mở (OpenSharing dành cho Kỹ năng tác nhân – Agent Skills) và các công cụ xây dựng tác nhân (Agent Bricks, Lakebase cho trí nhớ tác nhân), trong khi NVIDIA đồng thời mở rộng quan hệ đối tác AI Factory với HPE và các đối tác khác. Điều này định vị sự hợp tác hiện tại trong bối cảnh rộng lớn hơn của ngành công nghiệp, hướng tới xây dựng một hạ tầng tác nhân chuẩn hóa, sẵn sàng cho sản xuất .
Comments
0 comments