Siirtyminen Graviton4:n kahden kannan rakenteesta Graviton5:n yhtenäiseen piisiruun poistaa kokonaan suoritinkantojen välisen tiedonsiirron ylimääräisen rasituksen. Työkuormille, jotka jakautuvat useille ytimille – kuten reaaliaikaiset päättelyputket, keskusmuistitietokannat tai laajat mikropalvelulaivastot – pelkkä viiveen pieneneminen voi tuoda mitattavaa parannusta läpisyöttöön jo ennen käskykantakohtaisten parannusten huomioimista.
AWS:n julkaisemat sukupolvien väliset parannukset ovat yhdenmukaisia virallisten lähteiden, kolmannen osapuolen analyysien ja varhaisten asiakkaiden testitulosten kesken:
Laskenta ja läpisyöttö:
I/O ja tiedonsiirto:
Tuloksia oikeilta asiakkailta:
Nämä luvut ovat linjassa arkkitehtonisten muutosten kanssa. Viisinkertainen L3-välimuisti vähentää kalliita DRAM-hakuja, erityisesti tietokanta- ja analytiikkatyökuormissa, jotka käsittelevät suuria työsarjoja. Nopeampi DDR5-8800-muisti ja PCIe Gen 6 -I/O poistavat kaistanleveyden pullonkaulat, jotka rajoittivat läpisyöttöä aiemmilla sukupolvilla. Ja siirtymä yhden piisirun rakenteeseen vähentää sitä viiverasitusta, jota skaalautuvat sovellukset maksavat NUMA-arkkitehtuureissa.
Työkuormiin, jotka tarvitsevat nopeaa, väliaikaista ja suoraan instanssiin liitettyä tallennustilaa, AWS tarjoaa M9gd-version. Nämä instanssit yhdistävät paikallisen NVMe-pohjaisen SSD-lohkotallennuksen samaan Graviton5-laskenta-alustaan tarjoten jopa 11,4 TB paikallista NVMe SSD -kapasiteettia ja 30 % korkeammat IOPSit edellisen sukupolven paikalliseen tallennukseen verrattuna .
M9gd-versio on suunnattu työkuormille, kuten suurille välimuistilaivastoille, lokinkäsittelyputkille ja reaaliaikaisille analytiikkamoottoreille, joissa datan pitäminen mahdollisimman lähellä CPU:ta vaikuttaa suoraan kyselyviiveeseen ja läpisyöttöön. Yhdistelmä nopeampia ytimiä, alhaisempaa ydinten välistä viivettä ja korkeampia paikallisen tallennuksen IOPS-lukuja tekee M9gd:stä luontevan valinnan kaikkiin työkuormiin, jotka hyötyvät tallennus-laskentakuilun kaventamisesta.
Yksi huomattavimmista muutoksista Graviton5:n myötä on AWS:n selkeä kohdennus toiminnallisen tekoälyn työkuormiin – järjestelmiin, jotka suorittavat reaaliaikaista päättelyä, koodin generointia ja monivaiheista tehtävien organisointia käyttäen suuria kielimalleja ja muita generatiivisen tekoälyn tekniikoita .
Vaikka GPU- ja kiihdytininstanssit hallitsevat koulutus- ja suurten kerta-ajojen päättelykeskustelua, toiminnallinen tekoäly luo skaalautuessaan erilaisen laskentamallin: jatkuvaa, suuren läpisyötön CPU-työtä, joka vuorottelee mallin päättelyaskeleiden ja organisointilogiikan välillä tiukkojen viivebudjettien puitteissa monikierroksisia vuorovaikutuksia varten. AWS argumentoi, että Graviton5:n 33 % alhaisempi ydinten välinen viive, viisinkertainen välimuisti ja korkea ydintiheys tekevät siitä erityisen sopivan näihin työkuormiin, kun niitä ajetaan tuotannon skaalalla ilman GPU-taloudellisuuden rajoitteita .
Raakaa suorituskykyä suurempi, teknisesti merkittävin lisäys Graviton5-alustaan on Nitro Isolation Engine, uusi osa kuudennen sukupolven AWS Nitro -järjestelmässä .
Rust-ohjelmointikielellä toteutettu Nitro Isolation Engine on minimaalinen, erityisesti räätälöity hypervisor-komponentti, jonka tehtävä on valvoa eristystä samalla palvelimella olevien virtuaalikoneiden välillä . Sen erottaa kaikista muista tuotantohypervisoreista formaali verifiointi: AWS on tuottanut koneellisesti tarkistettavia todisteita käyttäen Isabelle-todistusavustinta, jotka matemaattisesti osoittavat
:
Käytännössä tämä tarkoittaa, että AWS voi tarjota matemaattisen varmuuden siitä, ettei yhden asiakkaan työkuorma voi päästä käsiksi toisen dataan tai häiritä tämän suoritusta, ja että samat eristysrajat koskevat myös AWS-operaattoreita . AWS on sitoutunut antamaan Nitro Isolation Enginen toteutuksen ja siihen liittyvät todisteet asiakkaiden tarkistettavaksi
.
Moottori on oletusarvoisesti käytössä M9g-instansseissa . Tämä edustaa muutosta pilviturvallisuuden varmennuksessa: siirtymistä operatiivisista kontrolleista ja tarkastuskertomuksista kohti koneellisesti tarkistettavia takeita perustavanlaatuisesta eristyskerroksesta.
Nimettyjä varhaisia käyttäjiä ja suorituskykytestauskumppaneita ovat muun muassa Meta, Snowflake, Uber, Honeycomb, SAP, Atlassian ja ClickHouse, sekä HubSpot ja muita yrityksiä, jotka on tunnistettu suorituskykytietojen paljastuksen kautta .
Asiakkaiden raportoimat tulokset kattavat useita työkuormaluokkia:
Nämä tulokset heijastavat Gravitonin käyttöönottokäyrällä näkyviä malleja: useimmat työkuormat näkevät välittömiä suorituskykyparannuksia ilman koodimuutoksia tai minimaalisilla muutoksilla siirryttäessä x86-arkkitehtuurista Arm:iin, ja hyödyt kertaantuvat sukupolvien yli piirien parantuessa .
Graviton5 saapuu hetkeen, jolloin Arm-pohjainen palvelinpiiri on muuttunut kustannusoptimoinnin vaihtoehdosta valtavirran suorituskykyvalinnaksi. Yli puolet uudesta AWS-CPU-kapasiteetista on pyörinyt Gravitonilla viimeiset kolme vuotta, ja 98 % tuhannesta suurimmasta EC2-asiakkaasta käyttää jo Graviton-pohjaisia instansseja .
Yhdistäen monoliittisen 192-ytimisen piisirun 3 nm prosessilla, PCIe Gen 6 -tuen, DDR5-8800-muistin ja formaalisti todennetun työkuorman eristyksen, Graviton5 nostaa rimaa paitsi AWS:n omille instanssiperheille, myös sille, mitä asiakkaat voivat kohtuudella odottaa pilvinatiivilta laskennalta: suorituskykyä, energiatehokkuutta ja turvallisuustakuita, jotka perustuvat matemaattiseen todistukseen operatiivisten lupausten sijaan.
M9g ja M9gd -instanssien yleinen saatavuus tarkoittaa, että nämä kyvykkyydet ovat nyt saavutettavissa tavanomaisten EC2-käyttöönottopolkujen kautta. Laskentateholtaan optimoitujen C9g- ja muistikapasiteetiltaan optimoitujen R9g-versioiden odotetaan seuraavan perässä .
Comments
0 comments