Rasgonin silmiinpistävin havainto on ilmiö, jota hän kutsuu "mätäpaise-efektiksi" – pullonkaulat leviävät koko sirujen toimitusketjussa. "Kaikkea vetää tämä kyltymätön tekoälyn laskentatehon kysyntä. En ole koskaan nähnyt mitään tässä mittakaavassa urani aikana," Rasgon sanoi .
Hän jäljitti leviämisen: puute alkoi GPU-kiihdyttimistä, siirtyi HBM-muistiin, sitten puolijohdevalmistuslaitteisiin, verkko- ja optiikkalaitteisiin, tehokomponentteihin, ja nyt jopa CPU:sta on pulaa .
Konkreettinen esimerkki kysynnän laajuudesta: jopa Intel, jolla oli "aiemmin arvottomaksi kirjattu varasto," on myynyt sen loppuun . Asiakkaat ovat kuulemma sanoneet Intelille: "Emme välitä, myykää se meille"
.
Kriittinen pullonkaula on HBM-muisti (High Bandwidth Memory), joka vie yli 85 prosenttia tekoälysirun pinta-alasta . Pinoamisen saannon ja logiikkapiirien yleiskustannusten vuoksi 1 gigatavun HBM:n valmistus vaatii noin neljä kertaa enemmän pinta-alaa kuin tavallinen DRAM-muisti
. Tämä selittää, miksi muistitarjonta ei ole pysynyt GPU-kysynnän perässä ja miksi muistien hinnoittelusta on tullut keskeinen tekijä sirujen kustannuksissa.
Rasgon nosti esiin yllättävän luvun: 72 GPU:n telineessä olevat 36 CPU:ta tuottavat Nvidialle noin 20 miljardin dollarin CPU-tulot. Tämä osoittaa, miten tekoälyn rakentaminen luo valtavaa sirukysyntää paljon laajemmalle kuin pelkille GPU-kiihdyttimille.
Rasgon korosti, että markkinoiden painopiste on siirtymässä mallien harjoittelusta tekoälyn päättelyyn (inference) – keskeinen kaupallistamispolku . Hän mainitsi Anthropicin tulojen nousun 9 miljardista dollarista 30 miljardiin dollarina suorana todisteena tästä siirtymästä
. Kun tekoälymallit siirtyvät tutkimusprojekteista tuotantoon, päättelyyn tarvittava laskentateho todennäköisesti ylittää harjoittelun vaatimukset.
Yleinen sijoittajien kysymys on, syrjäyttävätkö räätälöidyt ASIC-piirit (esimerkiksi Broadcomin valmistamat) lopulta Nvidian GPU:t. Rasgon uskoo, että molemmat elävät pitkällä aikavälillä rinnakkain kasvavilla markkinoilla . Hänen viitekehyksensä: ohjelmoitavat GPU:t sopivat paremmin tutkimukseen ja tutkivaan päättelyyn, kun taas ASIC-piirit loistavat ennustettavissa, suuren volyymin päättelytehtävissä. Kokonaismarkkina on riittävän suuri molemmille.
Rasgon päättää vakavaan varoitukseen. Lopullinen rajoite ei ole sirut, muisti eikä verkko – se on energia. Tekoälyinfrastruktuurin vaatima Yhdysvaltain sähköverkon kapasiteetin vuotuinen lisäys on noin 5 prosenttia . Tämä on valtava vaatimus verkolle, jonka kapasiteetti on kasvanut vain vähän vuosikymmeniin.
Hänen mukaansa seuraava tekoälyn innovaatio- ja pullonkaula-aalto kohdistuu väistämättä energiantuotantoon, jäähdytykseen ja ydinvoimaan . Ilman merkittäviä verkkosijoituksia superkierto saattaa törmätä energiakattoon.
Rasgonin viesti on selvä: niin kauan kuin tekoälyn kysyntä ei romahda, sirujen superkierto on todellinen ja kestävä. Mutta mahdollisuuksien luonne on muuttumassa. Helppo raha GPU-osakkeissa saattaa antaa tilaa monimutkaisemmalle maisemalle, jossa "pullonkaula" itsessään – olipa se sitten HBM, tehokomponentit tai energiainfra – muodostuu varallisuuden lähteeksi .
Comments
0 comments