喺傳統嘅VLA技術路線入面(包括小鵬自己嘅第一代系統),成個自動駕駛流程係咁嘅:鏡頭影到路面情況 -> 將呢啲視覺訊息轉化做類似語言嘅Token(標記)去理解 -> 再根據呢啲「語言化咗嘅理解」去推理 -> 最後先轉化做揸車指令(例如扭軚、煞車)。
但劉賢明博士就直接踩入嚟話呢種做法係錯嘅。佢接受訪問時好坦白咁講咗句:「語言係毒藥」。點解咁講?因為喺真實嘅馬路上,零點幾秒嘅延遲已經可以釀成意外。當系統仲要花時間將影像變成文字、再閱讀文字去推理,呢個過程會引入先天嘅滯後(Latency),仲會帶嚟一堆對駕駛嚟講完全無用嘅語義雜音。
VLA 2.0嘅做法就係乾脆唔要中間人。佢哋採用咗公司內部稱為**「視覺-隱含Token-動作」(Vision-Implicit Token-Action)**嘅路徑,直接由最原始嘅視覺訊號,一跳就去到駕駛指令,中間完全唔會產生任何語言形式嘅內部輸出 。
咁個系統仲聽唔聽得明人話?聽得明。呢個架構嘅重點係「內部運作」唔用語言,但佢依然可以接受語言作為「輸入指令」,例如司機開口講「去機場」或者撳Mon輸入導航地點,呢啲指令佢全部照單全收。只係喺執行駕駛呢個動作嘅過程入面,佢唔會自己同自己講嘢(唔會生成語言Token),直接由「眼」到「手」一氣呵成 。
小鵬高層對住Tesla FSD(Full Self-Driving)嘅比較,喺2026年春夏之間可以話係步步進逼,信心爆棚。
呢啲技術宣稱嘅背後,仲有嚟自最高層嘅私人賭注。2025年12月,CEO何小鵬就公開立咗一個「表現對賭協議」(Performance Wager):到咗2026年8月30號,小鵬嘅VLA系統必須要追到Tesla FSD v14.2喺美國矽谷嘅路面體驗水平 。呢場賭局嘅代價講到好白:如果團隊做唔到,負責人要「裸跑」
。
為咗證明自己唔係得把口,小鵬喺2026年5月仲搞咗場「武林大會」。佢哋專登請咗兩個美國嘅Tesla超級粉絲飛超過一萬公里嚟北京,將一架裝咗VLA 2.0嘅小鵬P7同裝咗FSD嘅Tesla Model 3擺埋同一條北京路線做正面對決。根據小鵬自己剪輯嘅片段,佢哋架車全程只需要司機接手2次,而Tesla就要接手7次 。
雖然何小鵬喺2026年北京車展等場合都不斷強調,目標係喺8月全面超越中國市場嘅Tesla FSD,但外界嘅實測就提醒大家要保持冷靜 。《Electrek》嘅編輯喺北京親身試完VLA 2.0之後,形容佢嘅表現同FSD v14「差唔多」,但補充咗好重要嘅一點:無論係邊套系統,司機都要全程𥄫實晒,隨時候命接手,遠遠未到可以放心完全自動駕駛嘅階段
。
小鵬呢場賭局,本質上係一次好大膽嘅技術路線抉擇。佢哋嘅工程師相信,由視覺到行動之間最快嘅路徑就係一條直線——哪怕咁樣做代表要將成部字典丟出車窗外面。喺自動駕駛呢個競賽入面,掟錢嘅狠勁、架構嘅反叛、同埋對Tesla窮追猛打嘅姿態,已經令到小鵬成為咗2026年最唔可以睇小嘅挑戰者。而最後到底邊個要除衫裸跑,8月就會有答案。
Comments
0 comments