Diese Betonung der "sauberen Herkunft" ist von zentraler Bedeutung. Berichten zufolge wurde MAI-Thinking-1 ausschließlich auf kommerziell lizenzierten Unternehmensdaten trainiert, und zwar ohne jegliche Destillation aus Drittmodellen, einschließlich OpenAIs GPT-Serie . Diese rechtliche und technische Unabhängigkeit erlaubt es Microsoft, seinen Unternehmenskunden ein Modell anzubieten, das sie vollständig besitzen und anpassen können – ohne die komplexen Lizenzbedingungen eines externen Anbieters. Nadella räumte ein, dass Microsoft "seine grundlegende Kontrolle im KI-Zeitalter durch sein eigenentwickeltes MAI-Sprachmodell stärkt und gleichzeitig den doppelten Vorteil der Partnerschaft mit OpenAI beibehält"
.
Der CEO von Microsoft AI, Mustafa Suleyman, lieferte die wirtschaftliche Begründung für Unternehmen. Er berichtete, dass die Feinabstimmung der MAI-Modelle für einen Kunden wie McKinsey nicht nur die Qualität von OpenAIs GPT-5.5 erreichte, sondern diese übertraf – bei gleichzeitiger Prognose einer bis zu zehnfach besseren Kosteneffizienz, basierend auf öffentlichen Preisdaten . Der Betrieb dieser Modelle auf Microsofts eigenem KI-Chip Maia 200 verstärkt den Kostenvorteil zusätzlich und schafft einen integrierten Hochenergie-Stapel (High-Efficiency Stack), der die Abhängigkeit von externen Lieferanten reduziert
. Diese Multi-Modell-Strategie ermöglicht es Microsoft, für jede Aufgabe – ob von OpenAI, Anthropic oder der eigenen MAI-Familie – das beste Modell innerhalb eines einheitlichen Rahmens zu nutzen, wie es bereits bei GitHub Copilot praktiziert wird
.
Neben der Modellentwicklung legte Nadella eine strenge operative Disziplin in Bezug auf die zentrale Ressource des KI-Zeitalters offen: Grafikprozessoren (GPUs). Bei branchenweit knappen Rechenkapazitäten fällte Microsoft eine bewusste strategische Entscheidung, auf kurzfristige Einnahmen zu verzichten. Berichte aus dem Juni 2026 bestätigen, dass Microsoft es abgelehnt hat, seine GPU-Kapazitäten an externe KI-Labore und andere potenzielle Kunden zu verkaufen .
Stattdessen hortet das Unternehmen diese wertvollen Ressourcen für eigene strategische Prioritäten. In der Build-2026-Keynote sprach Nadella davon, die "gesamte installierte GPU-Basis" anzuzapfen, indem Windows ML und Windows AI erweitert werden. Dadurch wird im Prinzip jedes kompatible Windows-Gerät zu einem Edge-Computing-Knoten für die lokale Ausführung von KI-Modellen auf dem Gerät . Diese Zuteilungsstrategie dient ausschließlich dem Aufbau des Portfolios mit dem höchsten Kundenlebenszeitwert (LTV). In einer früheren Bilanzpressekonferenz 2026 hatte Nadella diesen Ansatz bereits umrissen: "Wir wollen in der Lage sein, Kapazitäten so zuzuweisen, dass wir – solange wir angebotsbeschränkt sind – im Wesentlichen das beste LTV-Portfolio aufbauen können." Ein Großteil der jüngsten Produktbeschleunigung sei direkt darauf zurückzuführen, dass GPUs endlich den internen KI-Teams von Microsoft zugewiesen würden
.
Ein noch junger, aber entscheidender Teil von Nadellas öffentlichen Kommentaren weist auf die Zukunft der Abrechnung von KI-Diensten hin. In einem Gespräch mit Dwarkesh Patel argumentierte er, dass die grundlegenden Hebel des Geschäftsmodells – Werbung, Transaktionen, Abonnements und verbrauchsbasierte Preisgestaltung – gleich bleiben werden, sich aber die Verpackung ändern wird. Er beschrieb eine Zukunft, in der gestaffelte Abonnements als Berechtigungen für ein bestimmtes KI-Nutzungskontingent (Entitlements) dienen und Kunden so bei der Budgetplanung helfen, während Microsoft von der Nutzungsuhr profitiert .
Dieses Hybridmodell ist teilweise bereits Realität. Microsofts Coding-Geschäft über GitHub Copilot läuft bereits in großem Umfang sowohl benutzer- als auch nutzungsbasiert . Bei der Bilanzpressekonferenz für das dritte Quartal des Geschäftsjahres 2026 beschrieben Nadella und CFO Amy Hood eine weitere Verschiebung hin zu einer ergebnisorientierten Abrechnung, bei der Kunden für den Mehrwert bezahlen, den autonom für sie arbeitende KI-Agenten schaffen. "Man stellt einfach die Nutzung in Rechnung", fasste Hood zusammen. "Wenn diese Nutzung für den Kunden von großem Wert ist ... dann dreht sich [der Zähler] weiter und sie werden den Dienst weiter nutzen."
Einem Bericht zufolge stellten Copilot-Pläne zum 1. Juni 2026 auf eine nutzungsbasierte Abrechnung über GitHub AI Credits um
. Der breitere Rollout solcher Modelle für Microsoft 365 und Azure ist allerdings noch in der Entwicklung.
Die Einführung des MAI-Modells und die Details zur GPU-Strategie sind durch mehrere Berichte vom Juni 2026 gut belegt. Der konkrete Zeitplan und Umfang des hybriden Verbrauchspreis-Modells sind in der vorliegenden Quellenlage weniger detailliert definiert und stellen zum jetzigen Zeitpunkt ein wichtiges Richtungssignal der Microsoft-Führung dar und weniger eine vollständig ausgearbeitete, unternehmensweit implementierte Richtlinie.
Comments
0 comments