Arahan utamanya adalah terus terang dan mudah diingati: "Jangan gunakan model frontier untuk masalah bukan frontier." Beliau menggesa para pekerja untuk menyelaraskan penggunaan AI mereka, menunjukkan mod automatik Copilot sebagai alat terbina dalam untuk memadankan tugas dengan model bersaiz sesuai yang lebih murah secara bijak.
Ini bukan sekadar komen temu bual kasual. Ia adalah seorang CEO yang secara langsung menangani masalah budaya dan kewangan di dalam tembok syarikatnya sendiri, menandakan berakhirnya "fasa kebaharuan AI."
Amaran awam Nadella hanyalah hujung gunung ais yang jauh lebih besar. Ekonomi AI telah berubah secara dramatik, dan tabiat lama menggunakan model paling berkuasa secara lalai untuk setiap pertanyaan kini menjadi ancaman langsung kepada margin keuntungan. AI ejen, yang merangkaikan pelbagai panggilan model untuk menyelesaikan tugas, boleh menggunakan sehingga 1,000 kali ganda lebih banyak token daripada satu pertanyaan standard .
Sebagai contoh konkrit tentang letupan kos, Peter Steinberger, pencipta OpenClaw, mendakwa pasukannya membelanjakan lebih daripada $1.3 juta dalam token untuk menjalankan ejen AI . Malah Microsoft telah menghadapi tekanan kos dalaman; syarikat itu dilaporkan mula membatalkan lesen Claude Code langsung dan mengarahkan jurutera ke GitHub Copilot CLI, bukan sahaja kerana keutamaan vendor, tetapi kerana kos menggunakan model pihak ketiga yang berkuasa untuk pengekodan rutin meningkat di luar kawalan
.
Nadella sendiri merangka ini sebagai satu kebenaran mudah: anggap AI frontier sebagai sumber industri yang terhad dan mahal, bukan utiliti percuma .
Amaran Nadella di "Hard Fork" berkait secara langsung dengan transformasi menyeluruh model perniagaan teras Microsoft. Syarikat itu bergerak dari dunia di mana ia boleh hanya mengenakan bayaran rata bagi setiap pengguna manusia ke arah satu dunia di mana penggunaan ejen AI yang tidak dapat diramal dan meletup menentukan bil.
1. Memadankan Model dengan Tugas sebagai Kecekapan Teras
Desakan kecekapan melangkaui memo pemotongan kos yang mudah. Di Microsoft Build 2026, Nadella mengutarakan visi di mana setiap syarikat mesti membina "kecerdasan frontier" sendiri — gabungan model, data, dan penilaian peribadi — dan bukannya bergantung secara membuta tuli pada satu model bahasa besar yang mahal . Arahannya untuk mengelakkan model frontier untuk masalah mudah adalah prinsip perniagaan asas, bukan sekadar permintaan IT.
2. Ejen AI Diurus Seperti Pekerja
Nadella secara konsisten membina kes untuk menganggap ejen AI sebagai "pekerja digital." Ini melangkaui falsafah dan masuk ke dalam pelesenan. Microsoft dilaporkan merancang peringkat perusahaan Microsoft 365 baharu yang mengenakan caj setiap ejen dan bukannya setiap pengguna manusia, yang memerlukan ejen mempunyai identiti, alamat e-mel, dan dasar akses mereka sendiri sama seperti pekerja lain . Seperti yang dikatakan oleh Nadella, perniagaan itu beralih daripada menjadi "perniagaan alat pengguna akhir" kepada "perniagaan infrastruktur untuk menyokong ejen melakukan kerja"
.
3. Peralihan Harga Hibrid
Masa depan hasil Microsoft bergantung pada model harga baharu yang digariskan oleh Nadella semasa panggilan pendapatan Q3 2026: satu peralihan daripada "model tradisional setiap tempat duduk kepada model tempat duduk campur penggunaan yang baru muncul" . Hampir 60% pelanggan perkhidmatan pelanggan sudah menggunakan kredit berasaskan penggunaan, dan syarikat itu memindahkan GitHub Copilot kepada harga sejajar penggunaan berkuat kuasa 1 Jun 2026
. Model SaaS lama setiap tempat duduk tidak dapat bertahan apabila satu aliran kerja ejen boleh menggunakan lebih banyak pengiraan daripada ribuan interaksi manusia standard; Microsoft kini menggabungkan lesen asas yang boleh diramal dengan caj penggunaan untuk pengiraan berat
.
4. Industri yang Dipaksa untuk Menjadi Cekap
Komen Nadella mencerminkan realiti struktur di seluruh landskap AI. OpenAI, Anthropic, dan GitHub semuanya mengebil mengikut penggunaan token, yang secara asasnya memberi ganjaran kepada kecekapan dan menghukum pembaziran . Ramalan Goldman Sachs mengunjurkan bahawa beban kerja ejen boleh mendorong peningkatan 24 kali ganda dalam penggunaan token menjelang 2030, mencapai angka mengejutkan 120 kuadrilion token sebulan
. Dalam persekitaran ini, syarikat yang menguasai disiplin menghalakan ringkasan e-mel mudah kepada model kecil yang murah — dan menyimpan kuasa frontier untuk masalah yang tulen dan kompleks — akan menang dari segi struktur kos. Mereka yang tidak, akan tenggelam dalam bil awan mereka sendiri
.
Pengakuan Nadella "Saya juga seorang tokenmaxxer" bukan sekadar detik kejujuran yang menawan. Ia adalah arahan budaya dan strategik yang disasarkan dengan teliti, menandakan bahawa era AI Microsoft telah meninggalkan peringkat eksperimennya yang riang dan memasuki fasa di mana disiplin kos, penghalaan model pintar, dan pelesenan berasaskan ejen akan menentukan pemenang dan yang kalah dalam teknologi perusahaan.
Comments
0 comments