У традиційному конвеєрі VLA система діє послідовно: автомобіль «бачить» дорогу, перетворює це візуальне сприйняття на мовоподібні токени, а потім «міркує» над цими мовними токенами, щоб згенерувати дію. Доктор Лю описав цей проміжний крок як критичну слабкість, прямо заявивши, що «мова — це отрута» для водіння в реальному часі . Його аргумент полягає в тому, що мовні токени створюють природну затримку і вносять нерелевантний семантичний шум у процес, який вимагає реакції на рівні мілісекунд.
Модель VLA 2.0 повністю усуває це вузьке місце. Вона використовує те, що компанія називає шляхом «Vision-Implicit Token-Action», забезпечуючи наскрізне генерування команд водіння безпосередньо з візуальних даних, без жодного проміжного мовного представлення . Хоча система все ще може сприймати мову як вхідні дані — наприклад, навігаційну команду водія або голосову інструкцію — вона ніколи не створює власних мовних токенів як внутрішнього результату під час процесу керування
.
Керівництво XPeng не соромиться проводити прямі паралелі з Tesla. Їхні заяви протягом весни та літа 2026 року є різкою ескалацією впевненості. Доктор Лю заявив у своєму червневому інтерв'ю, що XPeng вже досягла паритету з Tesla FSD v13 в Китаї, і що досягнення продуктивності новішої FSD v14 «цілком реальне до кінця літа» .
Ці технічні заяви підкріплені незвично особистим зобов'язанням з самого верху. У грудні 2025 року генеральний директор Хе Сяопен оголосив публічне «парі на продуктивність», заявивши, що система VLA від XPeng має досягти рівня досвіду водіння Tesla FSD v14.2 у Кремнієвій долині до 30 серпня 2026 року . Ставки були озвучені чітко: якщо команда зазнає невдачі, відповідальна особа «бігатиме голяка»
.
Щоб підкріпити свою риторику, у травні 2026 року XPeng випустила відео порівняння «лоб у лоб», для якого до Китаю привезли двох американських ентузіастів Tesla. Постановочне порівняння зіштовхнуло XPeng P7 з VLA 2.0 та Tesla Model 3 з FSD на однакових маршрутах у Пекіні. Згідно з власною версією відео XPeng, їхньому автомобілю знадобилося лише 2 втручання водія, тоді як Tesla — 7 .
Хе Сяопен неодноразово наголошував, зокрема на Auto China 2026, що метою є повністю перевершити Tesla FSD на китайському ринку до серпня. Утім, незалежні огляди закликають до обережності. Редактор Electrek, який тестував VLA 2.0 в Пекіні, описав її продуктивність як «зіставну» з FSD v14, але зауважив, що обидві системи все ще потребують постійної уваги водія і далекі від повної автономності .
Наразі ці перегони залишаються швидкісною гонитвою, що визначається сміливими архітектурними ставками та ще сміливішими заявами. Рішення XPeng виключити мову зі свого «мозку водіння» — це розрахована авантюра, що найшвидший шлях від бачення до дії — це пряма лінія. Навіть якщо для цього доведеться викинути словник у вікно.
Comments
0 comments