Perinteisessä VLA-putkessa järjestelmä noudattaa peräkkäistä prosessia: auto näkee tien, muuntaa tämän visuaalisen havainnon kielenkaltaisiksi merkkijonoiksi (tokeneiksi) ja päättelee sitten näiden kielellisten merkkijonojen perusteella ajotoiminnon. Tohtori Liu kuvaili tätä välivaihetta kriittiseksi heikkoudeksi todeten suorasukaisesti, että "kieli on myrkkyä" reaaliaikaiselle ajamiselle . Hänen perustelunsa on, että kielelliset tokenit tuovat mukanaan luontaista viivettä ja syöttävät epäolennaista semanttista kohinaa prosessiin, joka vaatii millisekuntien reaktioita. Voisi verrata tilannetta siihen, että pikajuoksija kuvailisi ensin mielessään sanoin, mihin suuntaan aikoo pinkaista, sen sijaan että vain toimisi refleksillä.
VLA 2.0 -malli poistaa tämän pullonkaulan kokonaan. Se ottaa käyttöön niin kutsutun "Vision-Implicit Token-Action" (Näkö-epäsuora merkintä-toiminto) -polun, joka mahdollistaa ajokomentojen päästä päähän -generoinnin suoraan raaoista visuaalisista syötteistä ilman minkäänlaista kielellistä välivaihetta . Vaikka järjestelmä voi yhä vastaanottaa kieltä syötteenä – kuten kuljettajan navigointikomennon tai puhutun ohjeen – se ei koskaan tuota omia kielellisiä tokeneita sisäisenä tuotoksena ajamisen aikana
. XPeng esitteli järjestelmää CVPR-osastollaan fyysisen tekoälyn maailmanmallin rinnalla, ja siihen liittyvä tutkimuspaperi, DrivePTS, hyväksyttiin julkaistavaksi konferenssissa
.
XPengin johto ei ole ujostellut suorien vertailujen tekemistä Teslaan. Heidän väitteensä kevään ja kesän 2026 aikana merkitsevät jyrkkää luottamuksen nousua. Tohtori Liu totesi kesäkuisessa haastattelussaan XPengin saavuttaneen jo tasapään Teslan FSD v13:n kanssa Kiinassa, ja uudemman FSD v14:n suorituskyvyn vastaaminen on "saavutettavissa ennen kesän loppua" .
Näitä teknisiä väitteitä tukee epätavallisen henkilökohtainen sitoumus yhtiön huipulta. Joulukuussa 2025 toimitusjohtaja He Xiaopeng asetti julkisen "suorituskykyvedon" julistaen, että XPengin VLA-järjestelmän tulee vastata Teslan FSD v14.2:n ajokokemusta Piilaaksossa 30. elokuuta 2026 mennessä . Vedon panokset tehtiin selväksi: jos tiimi epäonnistuu, vastuuhenkilö "juoksee alasti"
. Tällainen räväkkä julistus kielii paitsi kovasta itseluottamuksesta, myös ainutlaatuisesta paineesta, jota kiinalaiset teknologiayhtiöt luovat itselleen kilpajuoksussa markkinajohtajuuteen.
Tukeakseen tarinaansa XPeng julkaisi toukokuussa 2026 vertailuvideon, jossa kaksi yhdysvaltalaista Tesla-harrastajaa tuotiin Kiinaan. Lavastettu vertailu asetti XPeng P7:n VLA 2.0:lla varustettuna vastakkain Tesla Model 3:n FSD:n kanssa identtisillä Pekingin reiteillä. XPengin oman videoversion mukaan sen ajoneuvo vaati vain 2 kuljettajan väliintuloa verrattuna Teslan 7:ään . Vaikka He Xiaopeng on toistanut useissa tilaisuuksissa, mukaan lukien Auto China 2026 -tapahtumassa, tavoitteena olevan Teslan FSD:n täydellinen päihittäminen Kiinan markkinoilla elokuuhun mennessä, riippumattomat arviot kehottavat maltillisuuteen. Electrekin toimittaja, joka testasi VLA 2.0:aa Pekingissä, kuvaili sen suorituskykyä "verrattavaksi" FSD v14:ään, mutta huomautti molempien järjestelmien vaativan yhä jatkuvaa kuljettajan huomiota ja olevan kaukana täysin autonomisesta
.
Toistaiseksi kilpajuoksu on nopeatempoinen takaa-ajo, jota määrittävät rohkeat arkkitehtoniset vedot ja vielä rohkeammat väitteet. XPengin päätös suunnitella kieli pois sen ajavista aivoista on laskelmoitu uhkapeli siitä, että nopein reitti näköhavainnosta toimintaan on suora viiva – vaikka se tarkoittaisi sanakirjan heittämistä ikkunasta ulos.
Comments
0 comments