Jego główne polecenie było bezpośrednie i zapadające w pamięć: „Nie używaj modeli z najwyższej półki do problemów, które na tę półkę nie zasługują”. Wezwał pracowników do dopasowywania mocy AI do zadań, wskazując na tryb automatyczny w Copilocie jako wbudowane narzędzie do inteligentnego przypisywania zadań do odpowiednio dopasowanego, tańszego modelu .
Nie była to tylko luźna uwaga rzucona w wywiadzie. To dyrektor generalny bezpośrednio odnoszący się do kulturowego i finansowego problemu wewnątrz własnej firmy, sygnalizujący koniec „fazy nowości AI”.
Publiczna reprymenda Nadelli to wierzchołek znacznie większej góry lodowej. Ekonomika sztucznej inteligencji zmieniła się diametralnie, a stary nawyk sięgania po najpotężniejszy model przy każdym zapytaniu stał się bezpośrednim zagrożeniem dla marży zysku. Agentowa AI, która łączy wiele wywołań modeli w łańcuch, aby wykonać zadanie, może zużywać nawet 1000 razy więcej tokenów niż standardowe pojedyncze zapytanie .
Jako konkretny przykład eksplozji kosztów, Peter Steinberger, twórca OpenClaw, twierdził, że jego zespół wydał ponad 1,3 miliona dolarów w tokenach na uruchamianie agentów AI . Nawet Microsoft odczuł wewnętrzną presję kosztową; firma podobno zaczęła anulować bezpośrednie licencje Claude Code i kierować inżynierów w stronę GitHub Copilot CLI nie tylko z powodu preferencji dostawcy, ale dlatego, że koszt używania potężnych modeli stron trzecich do rutynowego kodowania wymykał się spod kontroli
.
Sam Nadella ujął to jako prostą prawdę: traktujcie zaawansowaną AI jako rzadki, drogi zasób przemysłowy, a nie darmowe medium .
Ostrzeżenie Nadelli w „Hard Fork” jest bezpośrednio związane z gruntowną transformacją podstawowego modelu biznesowego Microsoftu. Firma odchodzi od świata, w którym mogła po prostu pobierać stałą opłatę za ludzkiego użytkownika, w stronę świata, w którym rachunek dyktuje nieprzewidywalna, gwałtowna konsumpcja agentów AI.
1. Dopasowywanie modeli do zadań jako kluczowa kompetencja
Nacisk na efektywność wykracza poza zwykłe cięcie kosztów. Na konferencji Microsoft Build 2026 Nadella przedstawił wizję, w której każda firma musi budować własną „inteligencję frontową” – połączenie modeli, danych i prywatnych ewaluacji – zamiast ślepo polegać na jednym, drogim dużym modelu językowym (LLM) . Jego nakaz, by unikać zaawansowanych modeli do prostych problemów, jest fundamentalną zasadą biznesową, a nie tylko prośbą działu IT.
2. Agenci AI zarządzani jak pracownicy
Nadella konsekwentnie buduje argumenty za traktowaniem agentów AI jako „cyfrowych pracowników”. To wykracza poza filozofię i wchodzi w sferę licencjonowania. Microsoft podobno planuje nowe korporacyjne plany Microsoft 365, które będą rozliczane za agenta, a nie za ludzkiego użytkownika, wymagając, aby agenci posiadali własne tożsamości, adresy e-mail i zasady dostępu, tak jak każdy inny pracownik . Jak ujął to Nadella, biznes zmienia się z „biznesu narzędzi dla użytkowników końcowych” w „biznes infrastrukturalny wspierający agentów wykonujących pracę”
.
3. Przejście na hybrydowy model cenowy
Przyszłość przychodów Microsoftu zależy od nowego modelu cenowego, który Nadella nakreślił podczas telekonferencji dotyczącej wyników za III kwartał 2026 roku: przejście od „tradycyjnego modelu 'za stanowisko' do powstającego modelu 'stanowiska plus zużycie'” . Prawie 60% klientów działu obsługi klienta korzysta już z kredytów opartych na zużyciu, a firma od 1 czerwca 2026 roku przestawiła GitHub Copilot na cennik oparty na wykorzystaniu
. Stary model SaaS oparty na opłacie za użytkownika po prostu nie może przetrwać, gdy pojedynczy przepływ pracy agenta może zużywać więcej mocy obliczeniowej niż tysiące standardowych interakcji międzyludzkich; Microsoft łączy teraz przewidywalną licencję bazową z opłatami konsumpcyjnymi za duże obciążenie obliczeniowe
.
4. Branża zmuszona do efektywności
Komentarz Nadelli odzwierciedla strukturalną rzeczywistość w całym krajobrazie AI. OpenAI, Anthropic i GitHub – wszystkie rozliczają się na podstawie zużycia tokenów, co zasadniczo nagradza efektywność i karze marnotrawstwo . Prognoza Goldman Sachs przewiduje, że obciążenia agentowe mogą do 2030 roku spowodować 24-krotny wzrost zużycia tokenów, osiągając oszałamiający poziom 120 biliardów tokenów miesięcznie
. W tym środowisku firmy, które opanują dyscyplinę przekierowywania prostego podsumowania e-maila do taniego, małego modelu – i rezerwowania mocy z najwyższej półki na autentycznie złożone problemy – wygrają pod względem struktury kosztów. Te, które tego nie zrobią, utoną we własnych rachunkach za chmurę
.
Wyznanie Nadelli „Ja też jestem tokenmaxxerem” nie było tylko momentem czarującej szczerości. Było to starannie wymierzona dyrektywa kulturowa i strategiczna, sygnalizująca, że era AI w Microsofcie opuściła beztroski, eksperymentalny etap i weszła w fazę, w której dyscyplina kosztowa, inteligentne trasowanie modeli i licencjonowanie oparte na agentach zdefiniują zwycięzców i przegranych w technologiach dla przedsiębiorstw.
Comments
0 comments