Lời chỉ đạo chính của ông rất thẳng thắn và đáng nhớ: "Đừng dùng mô hình tiên tiến cho những vấn đề không tiên tiến." Ông kêu gọi nhân viên 'điều chỉnh kích thước' việc sử dụng AI của họ, chỉ ra chế độ tự động của Copilot như một công cụ tích hợp sẵn để khớp nhiệm vụ với một mô hình phù hợp, ít tốn kém hơn.
Đây không chỉ là một nhận xét ngẫu nhiên trong một cuộc phỏng vấn. Đó là một CEO đang trực tiếp giải quyết một vấn đề văn hóa và tài chính ngay trong bức tường công ty mình, báo hiệu sự kết thúc của "giai đoạn mới lạ với AI".
Lời khiển trách công khai của Nadella chỉ là phần nổi của tảng băng chìm. Kinh tế học về AI đã thay đổi đáng kể, và thói quen cũ mặc định dùng mô hình mạnh nhất cho mọi truy vấn giờ đây là mối đe dọa trực tiếp đến biên lợi nhuận. AI tác nhân, vốn xâu chuỗi nhiều lần gọi mô hình để hoàn thành một nhiệm vụ, có thể tiêu thụ lượng token gấp 1.000 lần so với một truy vấn tiêu chuẩn .
Về một ví dụ cụ thể cho sự bùng nổ chi phí, Peter Steinberger, người tạo ra OpenClaw, tuyên bố nhóm của ông đã chi hơn 1,3 triệu đô la tiền token khi chạy các tác nhân AI . Ngay cả Microsoft cũng đã phải đối mặt với áp lực chi phí nội bộ; công ty được cho là đã bắt đầu hủy bỏ các giấy phép Claude Code trực tiếp và hướng các kỹ sư sang sử dụng GitHub Copilot CLI, không chỉ vì yêu thích nhà cung cấp, mà bởi chi phí sử dụng các mô hình mạnh mẽ của bên thứ ba cho việc lập trình thông thường đã vượt khỏi tầm kiểm soát
.
Chính Nadella đã đóng khung điều này như một sự thật đơn giản: hãy coi AI tiên tiến như một nguồn tài nguyên công nghiệp khan hiếm và đắt đỏ, chứ không phải một tiện ích miễn phí .
Lời cảnh báo của Nadella trên "Hard Fork" có mối liên hệ trực tiếp đến một sự chuyển đổi sâu rộng trong mô hình kinh doanh cốt lõi của Microsoft. Công ty đang chuyển mình từ một thế giới mà nó có thể chỉ thu phí cố định cho mỗi người dùng sang một thế giới mà việc tiêu thụ không thể đoán trước, bùng nổ của các tác nhân AI sẽ quyết định hóa đơn.
1. Khớp Mô hình với Nhiệm vụ như một Năng lực Cốt lõi
Động thái thúc đẩy hiệu quả này vượt xa một bản ghi nhớ cắt giảm chi phí đơn thuần. Tại Microsoft Build 2026, Nadella đã phác thảo một tầm nhìn nơi mỗi công ty phải xây dựng "trí thông minh tiên tiến" của riêng mình – sự kết hợp của các mô hình, dữ liệu và các đánh giá riêng – thay vì lệ thuộc một cách mù quáng vào một mô hình ngôn ngữ lớn đơn lẻ và đắt đỏ . Mệnh lệnh tránh dùng mô hình tiên tiến cho các vấn đề đơn giản là một nguyên tắc kinh doanh nền tảng, không chỉ là một yêu cầu về CNTT.
2. Tác nhân AI được Quản lý như Nhân viên
Nadella đã liên tục xây dựng luận điểm coi các tác nhân AI như "nhân viên số". Điều này vượt ra ngoài triết lý và đi vào cấp phép. Microsoft được cho là đang lên kế hoạch cho các gói Microsoft 365 doanh nghiệp mới tính phí theo tác nhân thay vì theo người dùng, yêu cầu các tác nhân phải có danh tính, địa chỉ email và chính sách truy cập riêng như bất kỳ nhân viên nào khác . Như Nadella đã nói, doanh nghiệp đang chuyển từ "một doanh nghiệp công cụ cho người dùng cuối" sang một "doanh nghiệp cơ sở hạ tầng hỗ trợ các tác nhân làm việc"
.
3. Sự Chuyển đổi Định giá Kết hợp
Tương lai doanh thu của Microsoft phụ thuộc vào một mô hình định giá mới mà Nadella đã vạch ra trong cuộc gọi báo cáo lợi nhuận quý 3 năm 2026: sự chuyển đổi từ "mô hình ghế truyền thống sang mô hình kết hợp ghế cộng tiêu thụ đang nổi lên" . Gần 60% khách hàng dịch vụ khách hàng đã sử dụng tín dụng dựa trên mức sử dụng, và công ty đã chuyển GitHub Copilot sang định giá phù hợp với mức sử dụng có hiệu lực từ ngày 1 tháng 6 năm 2026
. Mô hình SaaS thu phí theo ghế cũ đơn giản là không thể tồn tại khi một quy trình làm việc của tác nhân có thể tiêu thụ nhiều tài nguyên tính toán hơn hàng nghìn tương tác tiêu chuẩn của con người; Microsoft giờ đây kết hợp một giấy phép cơ bản có thể dự đoán được với phí tiêu thụ cho các tác vụ tính toán nặng
.
4. Một Ngành Công nghiệp Bị Buộc Phải Hiệu Quả
Bình luận của Nadella phản ánh một thực tế cấu trúc trên toàn bộ lĩnh vực AI. OpenAI, Anthropic và GitHub đều tính hóa đơn theo mức tiêu thụ token, điều này về cơ bản là thưởng cho sự hiệu quả và trừng phạt sự lãng phí . Một dự báo của Goldman Sachs dự đoán rằng khối lượng công việc của tác nhân có thể thúc đẩy mức tiêu thụ token tăng gấp 24 lần vào năm 2030, đạt mức đáng kinh ngạc 120 nghìn tỷ tỷ token mỗi tháng
. Trong môi trường này, các công ty nắm vững kỷ luật chuyển một bản tóm tắt email đơn giản sang một mô hình nhỏ, rẻ tiền – và dành sức mạnh tiên tiến cho các vấn đề phức tạp thực sự – sẽ chiến thắng về mặt cấu trúc chi phí. Những ai không làm vậy sẽ chết đuối trong chính hóa đơn đám mây của mình
.
Lời thú nhận "Tôi cũng là một tokenmaxxer" của Nadella không chỉ là một khoảnh khắc thành thật đáng yêu. Đó là một chỉ thị văn hóa và chiến lược được nhắm đến cẩn thận, báo hiệu rằng kỷ nguyên AI của Microsoft đã rời bỏ giai đoạn thử nghiệm vô tư lự và bước vào một giai đoạn mà kỷ luật chi phí, định tuyến mô hình thông minh và cấp phép dựa trên tác nhân sẽ xác định kẻ chiến thắng và kẻ thua cuộc trong công nghệ doanh nghiệp.
Comments
0 comments