Ma la realtà è che Anthropic si sta già muovendo in modo aggressivo sui prezzi. Il 9 giugno, appena due giorni prima che scoppiasse la notizia su OpenAI, Anthropic ha lanciato Claude Fable 5 a 10 dollari per milione di token in input e 50 dollari per milione di token in output, la metà del prezzo del suo precedente modello Mythos Preview. Il nuovo modello ha ottenuto un punteggio dell'80,3% su SWE-Bench Pro, con un vantaggio di 22 punti sul 58,6% di GPT-5.5 . Anthropic ha anche introdotto una modalità "Compact" 8 volte più economica e, il 14 maggio, ha rinnovato la sua struttura di abbonamento in modo che gli utenti intensivi di Claude Agent SDK venissero spostati da piani di abbonamento a tariffa fissa a una fatturazione API a consumo a partire dal 15 giugno
.
Una lettura onesta del panorama competitivo suggerisce che OpenAI non stia agendo da una posizione di forza. I tagli dei prezzi sono una risposta a una posizione di mercato che ha perso, non un gesto magnanimo .
Il CEO di OpenAI, Sam Altman, ha riconosciuto pubblicamente durante un recente evento che i costi di utilizzo dell'IA sono diventati "un grosso problema" per i clienti aziendali . Alexander Embiricos, responsabile enterprise di OpenAI, ha dichiarato a TechCrunch che le conversazioni con i clienti sono radicalmente cambiate: "Sei mesi fa, parlavo con un cliente e il tema era sempre 'Cosa può fare? È abbastanza buono?'. Ora le nostre conversazioni non riguardano più questo. Ora riguardano: 'Ehi, stiamo spendendo troppo. Che visibilità avete? Che auditabilità offrite?'"
.
La portata della spesa aziendale è sbalorditiva. Altman ha rivelato che un utente avanzato di OpenAI consuma 100 miliardi di token al mese, il che equivale a circa 100.000-300.000 dollari al mese a tariffe aziendali medie . Altman ha affermato che l'azienda vorrebbe fatturare l'IA "come l'elettricità", un modello a consumo che suona allettante in teoria, ma diventa terrificante per i direttori finanziari quando il contatore non smette mai di girare
.
La crisi dei prezzi non può essere compresa senza il parallelo crollo della narrativa produttiva del "tokenmaxxing". Tokenmaxxing, la pratica di trattare il consumo di token IA come un indicatore della produttività ingegneristica, è diventata una cultura interna in tutta la Silicon Valley per tutto il 2025 e l'inizio del 2026. Il New York Times ha riferito a marzo che un ingegnere di OpenAI ha elaborato 210 miliardi di token in una sola settimana, e in Amazon alcuni dipendenti hanno creato agenti IA per completare "compiti del tutto privi di significato o inutili" semplicemente per mantenere alte le loro statistiche di utilizzo dei token .
Ma i dati si sono decisamente rivoltati contro questa pratica. La società di analisi ingegneristica Faros AI, analizzando i dati di 22.000 sviluppatori distribuiti su 4.000 team, ha scoperto che mentre l'adozione dell'IA ha accelerato il completamento dei task (completamento attività aumentato del 34%, epiche del 66%), ha anche fatto aumentare i bug per sviluppatore del 54%, il tempo mediano di revisione del codice di 5 volte e il "churn" del codice (il tasso di modifica o cancellazione) di un incredibile 861% in ambienti ad alta adozione di IA .
I tassi iniziali di accettazione del codice, tra l'80 e il 90%, che i manager festeggiavano, si sono rivelati un miraggio. Quando i ricercatori hanno tracciato le revisioni del codice nelle settimane successive, il tasso di accettazione reale è crollato al 10-30%, rivelando un sostanziale debito tecnico nascosto . Jellyfish ha scoperto che il 10% dei maggiori utilizzatori di Claude Code ha consumato circa 10 volte più token dello sviluppatore medio, ma ha prodotto solo circa il doppio del lavoro
. Il costo per ogni "pull request" completata con successo è salito da 0,28 dollari con un uso leggero dell'IA fino a 89 dollari con un uso intensivo, secondo i dati della società di software Jellyfish
.
Anche al di là dell'ingegneria, il caso più ampio della produttività si sta sgretolando. Il rapporto "Global AI at Work" 2026 di BCG, che ha intervistato quasi 12.000 dipendenti operativi, ha rilevato che il 42% degli utenti abituali di IA ha dichiarato di risparmiare otto ore a settimana, l'equivalente di un'intera giornata lavorativa. Ma il 66% ha affermato di aver ricevuto poche o nessuna indicazione su cosa fare con quel tempo risparmiato, e la metà ha detto di non essere misurabilmente più produttiva . Il COO di Uber, Andrew Macdonald, ha ammesso che l'azienda ha faticato a collegare l'aumento della produttività dei singoli lavoratori con un impatto a livello aziendale
.
Il Chief Customer Officer di ServiceNow, Chris Bedi, ha catturato il crescente scetticismo senza mezzi termini: "È un po' come misurare il successo di un ristorante dalla quantità di cibo che compra, non da quanti clienti soddisfatti escono. C'è un conto da pagare per quei token" .
La conversazione aziendale è passata da "andare veloci" a "abbiamo bisogno di guardrail" . Questo cambiamento minaccia direttamente il modello di ricavi centrale dei fornitori di IA, che beneficiano di un utilizzo senza limiti.
Secondo quanto riferito, sia OpenAI che Anthropic si stanno preparando per un'offerta pubblica iniziale (IPO) . Questa tabella di marcia rende l'economia di una guerra dei prezzi particolarmente pericolosa. Tagli aggressivi dei prezzi dei token comprimono direttamente i margini proprio nel momento in cui entrambe le aziende devono dimostrare un'economia unitaria sostenibile agli investitori del mercato pubblico. Ridurre i prezzi senza corrispondenti riduzioni degli enormi costi di calcolo necessari per l'addestramento e l'inferenza potrebbe rendere la redditività ancora più sfuggente
.
Ma la preoccupazione più profonda degli investitori riguarda i costi di passaggio a un altro fornitore, o meglio, la loro mancanza. Un sondaggio condotto tra marzo e aprile 2026 da Wakefield Research su 200 dirigenti ha rilevato che il 79% era leggermente o molto preoccupato per il vincolo con i propri attuali fornitori di IA . Quando il risultato di un modello di IA è più o meno valido quanto quello di un altro per un determinato compito, e l'integrazione API è relativamente semplice, i clienti aziendali possono passare all'opzione più economica con un attrito minimo.
L'era dell'IA "all you can eat" è finita . Ciò che sta emergendo al suo posto assomiglia meno a una guerra tra piattaforme in cui il vincitore prende tutto, e più a una battaglia sui prezzi delle commodity in cui sopravvive il fornitore con la struttura dei costi più snella. Il piano di OpenAI di tagliare i prezzi è, in fondo, un riconoscimento del fatto che il prodotto stesso non è abbastanza differenziato da giustificare un premio, ora che i clienti controllano ogni singolo token.
Comments
0 comments