La sua direttiva principale è stata schietta e memorabile: "Non usate modelli di frontiera per problemi che non sono di frontiera" . Ha esortato i lavoratori a dimensionare l'uso dell'IA, indicando la modalità automatica di Copilot come uno strumento integrato per abbinare in modo intelligente l'attività a un modello di dimensioni appropriate e meno costoso.
Non si è trattato di un commento casuale durante un'intervista. Un CEO ha affrontato direttamente un problema culturale e finanziario all'interno delle mura della propria azienda, segnalando la fine della "fase di novità dell'IA".
La ramanzina pubblica di Nadella è solo la punta di un iceberg molto più grande. L'economia dell'IA è cambiata radicalmente e la vecchia abitudine di usare sempre il modello più potente per ogni richiesta è ora una minaccia diretta ai margini di profitto. L'IA agentiva, che concatena più chiamate al modello per completare un'attività, può consumare fino a 1.000 volte più token rispetto a una singola query standard .
Per fare un esempio concreto dell'esplosione dei costi, Peter Steinberger, il creatore di OpenClaw, ha dichiarato che il suo team ha speso più di 1,3 milioni di dollari in token per eseguire agenti IA . Persino Microsoft ha affrontato pressioni interne sui costi; stando ad alcune indiscrezioni, l'azienda avrebbe iniziato a cancellare le licenze dirette di Claude Code, indirizzando gli ingegneri verso GitHub Copilot CLI, non solo per una preferenza di fornitore, ma perché il costo dell'utilizzo di potenti modelli di terze parti per la codifica di routine stava andando fuori controllo
.
Lo stesso Nadella ha inquadrato la questione come una semplice verità: trattate l'IA di frontiera come una risorsa industriale scarsa e costosa, non come un'utenza gratuita .
L'avvertimento di Nadella a "Hard Fork" è direttamente collegato a una profonda trasformazione del modello di business principale di Microsoft. L'azienda si sta allontanando da un mondo in cui poteva semplicemente addebitare una tariffa fissa per utente umano, verso uno in cui è il consumo imprevedibile ed esplosivo degli agenti IA a dettare il conto.
1. L'abbinamento dei modelli ai compiti come competenza fondamentale
La spinta all'efficienza va oltre un semplice promemoria sul taglio dei costi. All'evento Microsoft Build 2026, Nadella ha articolato una visione in cui ogni azienda deve costruire la propria "intelligenza di frontiera" — una combinazione di modelli, dati e valutazioni private — invece di dipendere ciecamente da un unico e costoso modello linguistico di grandi dimensioni . Il suo ordine di evitare modelli di frontiera per problemi semplici è un principio di business fondamentale, non solo una richiesta del reparto IT.
2. Agenti IA gestiti come dipendenti
Nadella ha costantemente sostenuto l'idea di trattare gli agenti IA come "dipendenti digitali". Questo va oltre la filosofia e si estende alle licenze d'uso. Stando a quanto riportato, Microsoft starebbe pianificando nuovi livelli enterprise per Microsoft 365 che fanno pagare per agente piuttosto che per utente umano, richiedendo che gli agenti abbiano la propria identità, indirizzo email e criteri di accesso, proprio come qualsiasi altro dipendente . Come ha detto Nadella, il business si sta trasformando da "un business di strumenti per l'utente finale" a "un business di infrastrutture a supporto del lavoro degli agenti"
.
3. La transizione al prezzo ibrido
Il futuro dei ricavi di Microsoft dipende da un nuovo modello di prezzo che Nadella ha delineato durante la conferenza sugli utili del terzo trimestre 2026: un passaggio dal "tradizionale modello per postazione all'emergente modello postazioni più consumo" . Quasi il 60% dei clienti del servizio clienti utilizza già crediti basati sul consumo e l'azienda ha spostato GitHub Copilot a un prezzo allineato all'uso a partire dal 1° giugno 2026
. Il vecchio modello SaaS a posto fisso semplicemente non può sopravvivere quando un singolo flusso di lavoro agentivo può consumare più capacità di calcolo di migliaia di interazioni umane standard; Microsoft ora unisce una licenza base dal costo prevedibile con costi di consumo per il calcolo intensivo
.
4. Un'industria costretta a diventare efficiente
Il commento di Nadella riflette una realtà strutturale nell'intero panorama dell'IA. OpenAI, Anthropic e GitHub fatturano tutti in base al consumo di token, il che premia fondamentalmente l'efficienza e punisce lo spreco . Una previsione di Goldman Sachs stima che i carichi di lavoro agentivi potrebbero portare a un aumento di 24 volte del consumo di token entro il 2030, raggiungendo la sorprendente cifra di 120 quadrilioni di token al mese
. In questo contesto, le aziende che padroneggeranno la disciplina di indirizzare il riassunto di una semplice email a un modello piccolo ed economico — e riserveranno la potenza di frontiera per problemi autenticamente complessi — vinceranno sulla struttura dei costi. Quelle che non lo faranno affogheranno nelle proprie bollette del cloud
.
La confessione di Nadella — "Anch'io sono un tokenmaxxer" — non è stata solo un momento di affascinante onestà. È stata una direttiva culturale e strategica attentamente calibrata, che segnala come l'era dell'IA di Microsoft abbia lasciato la sua fase spensierata e sperimentale per entrare in una fase in cui la disciplina dei costi, l'instradamento intelligente dei modelli e le licenze basate sugli agenti definiranno vincitori e vinti nel mondo della tecnologia enterprise.
Comments
0 comments