기존의 전통적인 VLA 파이프라인에서는 자동차가 도로를 인식하면, 그 시각적 정보를 ‘언어와 유사한 토큰’으로 변환(번역)하고, 다시 그 언어 토큰을 바탕으로 추론하여 최종 주행 동작을 생성하는 순차적 과정을 거친다. 류 박사는 이 중간 언어 변환 과정이야말로 실시간 주행에 치명적인 약점이라고 지적하며, "언어는 독이다" 라는 강력한 표현까지 써 가며 맹비난했다 . 그의 주장에 따르면, 언어 토큰은 밀리초(ms) 단위의 반응 속도가 중요한 주행 과정에 본질적인 지연(latency)을 유발하고, 불필요한 의미적 노이즈를 주입하여 오히려 성능을 저하시킨다.
이러한 병목 현상을 해결하기 위해 VLA 2.0은 ‘언어’라는 중간 다리를 완전히 제거했다. 샤오펑이 ‘비전-암시적 토큰-액션(Vision-Implicit Token-Action)’ 경로라고 명명한 이 방식은, 원시 시각 입력 데이터로부터 어떤 중간 언어적 표상 없이도 곧바로 주행 명령을 생성하는 엔드-투-엔드 기술이다 . 다만 운전자가 “집으로 가줘”와 같은 음성 명령을 내리면 시스템이 이를 입력값으로 받아들일 수는 있지만, 주행 과정 중에는 절대 내부적으로 언어 토큰을 생성하지 않는다
. 샤오펑은 CVPR 현장 부스에서 이 시스템을 물리적 AI 월드 모델과 함께 전시했으며, 관련 연구 논문인 DrivePTS도 이번 컨퍼런스에서 정식 채택되었다
.
샤오펑은 테슬라와의 직접적인 비교도 전혀 주저하지 않는다. 2026년 봄과 여름에 걸쳐 이들의 자신감은 급격히 고조되고 있다. 류 박사는 6월 인터뷰에서 샤오펑이 중국 시장에서 이미 테슬라의 FSD v13과 동등한 성능(패리티)을 달성했으며, 더 최신 버전인 FSD v14의 성능을 따라잡는 것은 “여름이 끝나기 전에 가능한 목표”라고 주장했다 .
이러한 기술적 장담에는 최고경영자의 ‘공개 내기’라는 뒷이야기가 숨어 있다. 2025년 12월, 샤오펑의 CEO 허샤오펑(He Xiaopeng)은 대외적으로 성과 목표를 공표하며 승부수를 띄웠다. 바로 2026년 8월 30일까지 샤오펑의 VLA 시스템이 실리콘밸리에서 테슬라 FSD v14.2가 보여주는 실제 도로 주행 경험을 따라잡아야 한다는 것이다 . 이 내기의 조건은 더 파격적이었다. 만약 이 목표를 달성하지 못할 경우, 책임자가 “옷을 벗고 뛰겠다” 는 것이었다
. 한국 기업 문화에서는 상상하기 어려운 파격적인 조건이지만, 그만큼 목표 달성에 대한 CEO의 절박함과 자신감을 보여주는 대목이다.
샤오펑은 자신감을 입증하기 위한 자체 비교 영상도 공개했다. 2026년 5월에는 미국의 테슬라 마니아 두 명을 중국으로 초청해, 베이징의 동일한 루트에서 샤오펑 P7(VLA 2.0 탑재)과 테슬라 모델 3(FSD 탑재)를 직접 비교 주행하게 했다. 샤오펑이 편집해 공개한 영상에 따르면, 샤오펑 P7은 단 2회 운전자 개입이 필요했던 반면, 테슬라는 무려 7회나 개입이 발생했다 .
하지만 이러한 자체 홍보 영상을 액면 그대로 받아들이기에는 주의가 필요하다. 허샤오펑 CEO가 2026 오토 차이나(Auto China) 등 여러 행사에서 8월까지 중국 시장에서 테슬라 FSD를 완전히 능가하겠다는 목표를 반복했지만, 독립적인 리뷰는 좀 더 신중한 입장이다. Electrek의 편집자가 베이징에서 VLA 2.0을 직접 시승해 본 후, 그 성능이 FSD v14와 “유사한 수준(comparable)”이라고 평가하면서도, 두 시스템 모두 아직은 완전한 자율주행과는 거리가 멀고 운전자의 지속적인 주의가 필수적이라고 지적했다 .
현재로서는 이 레이스는 대담한 아키텍처 선택과 더욱 대담한 주장들로 점철된 고속 추격전이다. 연간 수천억 원의 자금을 쏟아붓는 샤오펑의 과감한 투자는 자율주행 기술의 패권을 쥐기 위한 결연한 의지의 표현임에 틀림없다. VLA 2.0에서 시도한 ‘언어 제거’는 시각에서 동작으로 이어지는 가장 빠른 길을 찾기 위한 계산된 도박이다. 비록 사전을 창밖으로 던져버리는 극단적인 선택일지라도 말이다. 과연 이 위험한 승부수가 샤오펑에게 테슬라를 넘어설 결정적 열쇠가 될 수 있을지, 2026년 8월 그 결말에 업계의 이목이 집중되고 있다.
Comments
0 comments