Zijn belangrijkste richtlijn was bot en gedenkwaardig: "Gebruik geen grensverleggende modellen voor problemen die niet grensverleggend zijn." Hij spoorde werknemers aan hun AI-gebruik op maat te maken en wees op de automatische modus van Copilot als een ingebouwde tool die taken intelligent koppelt aan een passend, goedkoper model.
Dit was niet zomaar een terloopse opmerking in een interview. Het was een CEO die rechtstreeks een cultureel en financieel probleem binnen zijn eigen bedrijfsmuren aankaartte en daarmee het einde van de "AI-nieuwigheidsfase" inluidde.
De publiekelijke terechtwijzing van Nadella is slechts het topje van een enorme ijsberg. De economie van AI is drastisch veranderd en de oude gewoonte om standaard het krachtigste model te kiezen voor elke vraag vormt nu een directe bedreiging voor de winstmarges. Agentische AI, die meerdere modelaanroepen aan elkaar koppelt om een taak te voltooien, kan tot 1000 keer meer tokens verbruiken dan een standaard vraag .
Een concreet voorbeeld van de kostenexplosie komt van Peter Steinberger, de maker van OpenClaw. Hij stelde dat zijn team meer dan $1,3 miljoen aan tokens had uitgegeven om AI-agents te laten draaien . Zelfs Microsoft kreeg te maken met interne kostendruk; volgens berichten begon het bedrijf met het annuleren van directe Claude Code-licenties en stuurde het ingenieurs richting GitHub Copilot CLI. Dit was niet alleen een keuze voor een eigen product, maar ook ingegeven doordat de kosten van dure modellen van derden voor alledaagse programmeertaken uit de hand liepen
.
Nadella zelf vatte het samen als een simpele waarheid: behandel grensverleggende AI als een schaarse, dure industriële grondstof, niet als een gratis nutsvoorziening .
De waarschuwing van Nadella in 'Hard Fork' hangt nauw samen met een ingrijpende transformatie van Microsofts kernactiviteiten. Het bedrijf beweegt zich weg van een wereld waarin het simpelweg een vast bedrag per gebruiker kon rekenen, naar een wereld waarin het onvoorspelbare, explosieve verbruik van AI-agents de rekening bepaalt.
1. Taken aan modellen koppelen als kerncompetentie
De efficiëntieslag gaat verder dan een simpel memo om kosten te besparen. Op Microsoft Build 2026 schetste Nadella een visie waarin elk bedrijf zijn eigen 'grensverleggende intelligentie' moet bouwen – een combinatie van modellen, data en private evaluaties – in plaats van blind te vertrouwen op één enkel, duur taalmodel . Zijn voorschrift om grensverleggende modellen niet voor simpele problemen te gebruiken, is een fundamenteel bedrijfsprincipe en niet zomaar een IT-verzoek.
2. AI-agents beheren als werknemers
Nadella heeft consequent de argumentatie opgebouwd om AI-agents te behandelen als 'digitale werknemers'. Dit gaat verder dan filosofie en heeft gevolgen voor de licenties. Microsoft zou plannen hebben voor nieuwe Microsoft 365-enterprise-abonnementen die per agent in rekening worden gebracht in plaats van per menselijke gebruiker. Dit zou betekenen dat agents een eigen identiteit, e-mailadres en toegangsbeleid moeten hebben, net als elke andere medewerker . Zoals Nadella het verwoordde: het bedrijf verschuift van een "eindgebruikerstools-bedrijf" naar een "infrastructuurbedrijf ter ondersteuning van agents die werk verrichten"
.
3. De overgang naar hybride prijsmodellen
De inkomsten van Microsoft zullen in de toekomst afhangen van een nieuw prijsmodel dat Nadella uiteenzette tijdens de Q3 2026-winstoproep: een verschuiving van "het traditionele per-stoel-model naar het opkomende model van stoelen plus verbruik" . Bijna 60% van de klanten in de klantenservice maakt al gebruik van op verbruik gebaseerde credits, en op 1 juni 2026 is GitHub Copilot overgestapt op een prijsmodel dat aan het gebruik is gekoppeld
. Het oude SaaS-model met een vast bedrag per gebruiker kan simpelweg niet overleven als één enkele agentische workflow meer computerkracht kan verbruiken dan duizenden standaard menselijke interacties. Microsoft combineert nu een voorspelbare basislicentie met verbruikskosten voor intensief computergebruik
.
4. Een industrie die gedwongen wordt efficiënt te worden
Nadella's commentaar weerspiegelt een structurele realiteit in het hele AI-landschap. OpenAI, Anthropic en GitHub factureren allemaal op basis van tokenverbruik, wat efficiëntie fundamenteel beloont en verspilling afstraft . Een prognose van Goldman Sachs voorspelt dat agentische werklasten tegen 2030 kunnen leiden tot een 24-voudige toename van het tokenverbruik, tot een duizelingwekkende 120 biljard tokens per maand
. In deze omgeving zullen de bedrijven die de discipline beheersen om een simpele e-mail samenvatting door te sturen naar een goedkoop, klein model – en de grensverleggende kracht te reserveren voor echte, complexe problemen – de slag om de kostenstructuur winnen. De bedrijven die dat niet doen, zullen verdrinken in hun eigen cloud-rekeningen
.
Bekentenis van Nadella dat hij "zelf ook een tokenmaxxer" is, was niet alleen een charmant moment van eerlijkheid. Het was een zorgvuldig gerichte culturele en strategische richtlijn, die aangeeft dat het AI-tijdperk van Microsoft zijn zorgeloze, experimentele fase heeft verlaten. Het bedrijf is een fase ingegaan waarin kostendiscipline, intelligente model-routering en licenties op basis van agents de winnaars en verliezers in de zakelijke technologie zullen bepalen.
Comments
0 comments