Hans huvudbudskap var rättframt och minnesvärt: "Använd inte de mest avancerade modellerna för problem som inte kräver det." Han uppmanade sina medarbetare att anpassa sin AI-användning och pekade på Copilots autoläge som ett inbyggt verktyg för att intelligent matcha uppgiften med en lämplig, billigare modell.
Detta var inte bara en avslappnad intervjukommentar. Det var en vd som direkt adresserade ett kulturellt och finansiellt problem inom sitt eget företags väggar, och signalerade slutet på vad man kan kalla AI:ns "experimentfas".
Nadellas offentliga utskällning är toppen på ett mycket större isberg. AI-ekonomin har förändrats dramatiskt, och den gamla vanan att alltid välja den kraftfullaste modellen är nu ett direkt hot mot vinstmarginalerna. Agentbaserad AI, som kedjar ihop flera modellanrop för att slutföra en uppgift, kan förbruka upp till 1 000 gånger fler tokens än en vanlig sökning .
För ett konkret exempel på kostnadsexplosionen hävdade Peter Steinberger, skaparen av OpenClaw, att hans team spenderade över 1,3 miljoner dollar i tokens på att driva AI-agenter . Även Microsoft har känt av interna kostnadstryck; företaget ska ha börjat avbryta direkta Claude Code-licenser och istället styrt sina utvecklare mot GitHub Copilot CLI. Detta inte bara av leverantörspreferens, utan för att kostnaden för att använda kraftfulla tredjepartsmodeller för rutinmässig kodning började skena okontrollerat
.
Nadella själv formulerade det som en enkel sanning: behandla den mest avancerade AI:n som en knapp, dyr industriell resurs, inte som en gratis allmännytta .
Nadellas varning i "Hard Fork" är direkt kopplad till en genomgripande omvandling av Microsofts kärnaffärsmodell. Företaget rör sig bort från en värld där det kunde ta en fast avgift per mänsklig användare, mot en där den oförutsägbara, explosiva konsumtionen av AI-agenter dikterar notan.
1. Att matcha modeller mot uppgifter blir en kärnkompetens
Effektiviseringsjakten går bortom ett enkelt sparmemo. På Microsoft Build 2026 presenterade Nadella en vision där varje företag måste bygga sin egen "frontier intelligence" – en kombination av modeller, data och privata utvärderingar – snarare än att blint förlita sig på en enda, dyr stor språkmodell . Hans direktiv om att undvika de främsta modellerna för enkla problem är en grundläggande affärsprincip, inte bara en IT-uppmaning.
2. AI-agenter som hanteras som anställda
Nadella har konsekvent byggt ett case för att behandla AI-agenter som "digitala medarbetare". Detta går bortom filosofi och in i licensieringen. Microsoft planerar enligt uppgift nya Microsoft 365 Enterprise-nivåer som debiterar per agent snarare än per mänsklig användare. Agenter ska ha sina egna identiteter, e-postadresser och åtkomstpolicyer, precis som vilken annan anställd som helst . Som Nadella uttryckte det: affärsverksamheten skiftar från att vara en verksamhet för slutanvändarverktyg till att bli en "infrastrukturverksamhet som stödjer agenters arbete"
.
3. Övergången till hybridprissättning
Framtiden för Microsofts intäkter hänger på en ny prismodell som Nadella beskrev under sin kvartalsrapport för Q3 2026: ett skifte från "den traditionella per-användare-modellen till den framväxande modellen med platser plus konsumtion" . Nästan 60 procent av kundtjänstkunderna använder redan förbrukningsbaserade krediter, och företaget flyttade GitHub Copilot till användningsbaserad prissättning från den 1 juni 2026
. Den gamla SaaS-modellen med fasta platser kan helt enkelt inte överleva när ett enda agentbaserat arbetsflöde kan förbruka mer datorkraft än tusentals vanliga mänskliga interaktioner. Microsoft blandar nu en förutsägbar grundlicens med förbrukningsavgifter för tung beräkning
.
4. En bransch som tvingas bli effektiv
Nadellas reflektion speglar en strukturell verklighet över hela AI-landskapet. OpenAI, Anthropic och GitHub fakturerar alla efter tokenförbrukning, vilket i grunden belönar effektivitet och bestraffar slöseri . En prognos från Goldman Sachs förutspår att agentbaserade arbetsbelastningar kan driva en 24-faldig ökning av tokenkonsumtionen till 2030, till svindlande 120 biljarder tokens per månad
. I den här miljön kommer de företag som bemästrar disciplinen att dirigera en enkel e-postsammanfattning till en billig, liten modell – och reservera den tunga kraften för genuint komplexa problem – att vinna på kostnadsstruktur. De som inte gör det kommer att drunkna i sina egna molnräkningar
.
Nadellas bekännelse – "Jag är också en tokenmaxxare" – var inte bara ett ögonblick av charmig ärlighet. Det var ett omsorgsfullt riktat kulturellt och strategiskt direktiv, som signalerar att Microsofts AI-era har lämnat sitt bekymmerslösa, experimentella stadium och gått in i en fas där kostnadsdisciplin, intelligent modellrouting och agentbaserad licensiering kommer att definiera vinnarna och förlorarna inom företagsteknologin.
Comments
0 comments