Việc nhấn mạnh vào "dòng dõi sạch" là cực kỳ quan trọng. Các báo cáo chỉ ra rằng MAI-Thinking-1 được huấn luyện trên dữ liệu doanh nghiệp được cấp phép thương mại và tuyệt đối không sử dụng kỹ thuật 'chưng cất' (distillation) từ bất kỳ mô hình bên thứ ba nào, bao gồm cả dòng GPT của OpenAI . Sự độc lập về mặt pháp lý và kỹ thuật này cho phép Microsoft cung cấp cho khách hàng doanh nghiệp một mô hình mà họ có thể toàn quyền sở hữu và tùy chỉnh, tránh được những phức tạp về cấp phép thường thấy khi sử dụng nhà cung cấp thứ ba. Nadella thừa nhận Microsoft đang "củng cố quyền kiểm soát nền tảng trong kỷ nguyên AI thông qua mô hình ngôn ngữ lớn MAI tự phát triển, trong khi vẫn duy trì lợi thế kép từ quan hệ đối tác với OpenAI"
.
Giám đốc điều hành mảng AI của Microsoft, Mustafa Suleyman, đã đưa ra lời chào hàng sát sườn cho doanh nghiệp về tính hiệu quả. Ông cho biết sau khi tinh chỉnh các mô hình MAI cho một khách hàng như McKinsey, chúng không chỉ sánh ngang mà còn vượt trội hơn GPT-5.5 của OpenAI về chất lượng, trong khi dự kiến mang lại hiệu quả chi phí tốt hơn đến mười lần dựa trên dữ liệu giá công khai . Việc chạy những mô hình này trên con chip AI nội bộ Maia 200 của Microsoft càng khuếch đại lợi thế về chi phí, tạo ra một ngăn xếp tích hợp, hiệu suất cao giúp giảm sự phụ thuộc vào các nhà cung cấp bên ngoài
. Chiến lược đa mô hình này cho phép Microsoft sử dụng mô hình tốt nhất cho từng tác vụ—dù là của OpenAI, Anthropic hay từ chính dòng MAI của mình—trong một 'bộ khung' thống nhất, giống như bộ khung đang vận hành cho GitHub Copilot
.
Vượt ra ngoài việc phát triển mô hình, Nadella tiết lộ một nguyên tắc vận hành nghiêm ngặt xung quanh tài nguyên cốt lõi của kỷ nguyên AI: bộ xử lý đồ họa (GPU). Trong bối cảnh năng lực tính toán bị thắt chặt trên toàn ngành, Microsoft đã có một lựa chọn chiến lược đầy tỉnh táo là khước từ doanh thu ngắn hạn. Các báo cáo từ tháng 6 năm 2026 xác nhận rằng Microsoft đã từ chối bán công suất GPU của mình cho các phòng thí nghiệm AI bên ngoài cũng như những khách hàng tiềm năng khác .
Thay vào đó, công ty đang tích trữ nguồn tài nguyên quý giá này cho các ưu tiên chiến lược của chính mình. Trong bài phát biểu quan trọng tại Build 2026, Nadella nói về việc khai thác "toàn bộ cơ sở cài đặt GPU" bằng cách mở rộng Windows ML và Windows AI, biến mọi thiết bị Windows tương thích thành một nút điện toán biên để chạy các mô hình AI cục bộ, trên chính thiết bị đó . Chiến lược phân bổ này hoàn toàn nhằm xây dựng danh mục đầu tư có giá trị vòng đời (LTV) cao nhất. Trong một cuộc họp báo cáo thu nhập đầu năm 2026, Nadella đã định hình cách tiếp cận này: "Chúng tôi muốn có thể phân bổ công suất trong khi nguồn cung còn hạn chế, theo cách cho phép [chúng tôi] về cơ bản xây dựng danh mục LTV [giá trị vòng đời] tốt nhất," và phần lớn sự tăng tốc sản phẩm gần đây là kết quả trực tiếp của việc cuối cùng cũng điều hướng GPU đến các đội ngũ AI nội bộ của Microsoft
.
Một phần còn sơ khai nhưng cực kỳ quan trọng trong bình luận công khai của Nadella hướng đến tương lai về cách Microsoft sẽ tính phí cho AI. Trong một cuộc thảo luận với Dwarkesh Patel, ông lập luận rằng các đòn bẩy mô hình kinh doanh cơ bản—quảng cáo, giao dịch, thuê bao và tiêu thụ—sẽ vẫn giữ nguyên, nhưng cách đóng gói sẽ thay đổi. Ông mô tả một tương lai nơi các gói thuê bao phân cấp hoạt động như 'quyền lợi' cho một lượng tiêu thụ AI nhất định, giúp khách hàng lập ngân sách trong khi Microsoft hưởng lợi từ 'đồng hồ đo' mức sử dụng .
Mô hình lai này một phần đã đi vào thực tế. Mảng kinh doanh lập trình của Microsoft, thông qua GitHub Copilot, hiện đã vận hành trên quy mô lớn dựa trên cả người dùng và mức sử dụng . Trong cuộc họp báo cáo thu nhập quý 3 năm tài chính 2026, Nadella và Giám đốc Tài chính Amy Hood đã mô tả một sự dịch chuyển xa hơn tới thanh toán dựa trên kết quả, nơi khách hàng trả tiền cho giá trị được tạo ra bởi các tác nhân AI hoạt động tự động thay mặt họ. Hood tóm tắt: "Bạn sẽ chỉ tính tiền cho mức sử dụng. Nếu mức sử dụng đó mang lại giá trị lớn cho khách hàng… thì họ sẽ tiếp tục quay [đồng hồ đo], và họ sẽ tiếp tục sử dụng dịch vụ"
. Một báo cáo ghi nhận rằng từ ngày 1 tháng 6 năm 2026, các gói Copilot sẽ chuyển sang thanh toán dựa trên mức sử dụng thông qua GitHub AI Credits, dù lộ trình triển khai rộng hơn trên Microsoft 365 và Azure vẫn là một câu chuyện đang phát triển
.
Thông tin về việc ra mắt mô hình MAI và chiến lược GPU được nhiều báo cáo trong tháng 6/2026 kiểm chứng. Các mốc thời gian và phạm vi cụ thể của mô hình định giá kết hợp giữa thuê bao và mức tiêu thụ ít được định nghĩa rõ ràng hơn trong bộ nguồn này, thể hiện một tín hiệu định hướng quan trọng từ ban lãnh đạo Microsoft hơn là một chính sách đã được hoàn thiện và triển khai trên toàn công ty tại thời điểm này.
Comments
0 comments