Rasgon wies darauf hin, dass die vier größten US-Cloud-Anbieter – Amazon, Microsoft, Google und Meta – im Jahr 2026 rund 725 Milliarden Dollar für Investitionsausgaben planen, wovon der Großteil in KI-Infrastruktur fließt . Die Speicherpreise haben einen senkrechten Anstieg hingelegt: DRAM-Preise stiegen zum Jahresbeginn 2026 um etwa 90 % im Quartalsvergleich
.
Eine der bemerkenswertesten Beobachtungen Rasgons ist der sogenannte „Whack-a-Mole“-Effekt – Engpässe, die sich durch die gesamte Chip-Lieferkette ausbreiten. „Alles wird von dieser unersättlichen Nachfrage nach KI-Rechenleistung angetrieben. Ich habe in meiner Karriere noch nie etwas in diesem Ausmaß gesehen“, sagte Rasgon .
Er zeichnete die Ausbreitung nach: Engpässe begannen bei GPU-Beschleunigern, gingen dann auf HBM-Speicher über, dann auf Halbleiterproduktionsanlagen, dann auf Netzwerk und Optik, dann auf Leistungschips, und inzwischen sind sogar CPUs knapp .
Ein konkretes Beispiel für die Reichweite der Nachfrage: Selbst Intel, das „zuvor wertlose Lagerbestände“ hatte, hat alles ausverkauft . Kunden sagten Berichten zufolge zu Intel: „Uns ist egal, verkauft es uns einfach“
.
Ein kritischer Engpass ist der High-Bandwidth Memory (HBM), der mehr als 85 % der Siliziumfläche eines KI-Chips ausmacht . Aufgrund von Stapelausbeuten und Logikdie-Overhead erfordert die Herstellung von 1 GB HBM etwa die vierfache Siliziumfläche von Standard-DRAM
. Diese Rechnung erklärt, warum das Speicherangebot nicht mit der GPU-Nachfrage Schritt halten kann und warum die Speicherpreise zu einem dominierenden Faktor bei den Chipkosten geworden sind.
Rasgon hob einen überraschenden Datenpunkt hervor: In einem Rack mit 72 GPUs generieren die 36 darin enthaltenen CPUs einen CPU-Umsatz von rund 20 Milliarden Dollar für Nvidia. Dies verdeutlicht, wie der KI-Ausbau eine massive Chip-Nachfrage weit über die reinen GPU-Beschleuniger hinaus schafft.
Rasgon betonte, dass sich der Marktfokus vom Modelltraining auf die KI-Inferenz verlagert – der Kernweg zur Monetarisierung . Er führte den Umsatzsprung von Anthropic von 9 Milliarden auf 30 Milliarden Dollar als direkten Beleg für diesen Wandel an
. Da KI-Modelle von Forschungsprojekten in die Produktion übergehen, wird die für Inferenz benötigte Rechenleistung die Trainingsworkloads voraussichtlich weit übertreffen.
Eine häufige Anlegerfrage ist, ob kundenspezifische ASICs (wie die von Broadcom) Nvidias GPUs irgendwann verdrängen werden. Rasgon glaubt, dass beide langfristig in einem wachsenden Markt koexistieren werden . Sein Rahmenkonzept: Programmierbare GPUs eignen sich besser für Forschung und explorative Inferenz, während ASICs bei vorhersagbaren, hochvolumigen Inferenzaufgaben glänzen. Der gesamte adressierbare Markt ist groß genug, um beide aufzunehmen.
Rasgon schloss mit einer ernüchternden Anmerkung. Die letzte Einschränkung sind nicht Chips, nicht Speicher, nicht Netzwerk – es ist die Energie. KI-Infrastruktur erfordert eine jährliche Steigerung der US-Stromnetzkapazität um etwa 5 %, um das Wachstumstempo zu halten . Dies ist eine atemberaubende Anforderung an ein Netz, das seit Jahrzehnten nur minimale Kapazitätssteigerungen erfahren hat.
Er argumentierte, dass die nächste Welle der KI-Innovation und der Engpässe unweigerlich auf die Energieerzeugung, Kühlung und Kernkraft fallen wird . Ohne erhebliche Investitionen in das Stromnetz könnte der Superzyklus selbst an eine Leistungsobergrenze stoßen.
Rasgons Botschaft ist klar: Solange die KI-Nachfrage nicht zusammenbricht, ist der Halbleiter-Superzyklus real und nachhaltig. Aber die Art der Chancen verschiebt sich. Das einfache Geld mit GPU-Aktien könnte einer komplexeren Landschaft weichen, in der der „Engpass“ selbst – sei es in HBM, Leistungschips oder Energieinfrastruktur – zum Vermögensgenerator wird .
Comments
0 comments