VLA 2.0模型彻底消除了这个瓶颈。它采用了公司所称的**“视觉-隐式数据块-行动”** 路径,实现了从原始视觉输入直接端到端生成驾驶指令,中间没有任何语言表述环节 。虽然系统仍然可以接受语言作为输入——例如驾驶员的导航指令或语音命令——但在驾驶行为过程中,它绝不会将语言数据块作为内部输出自行生成
。小鹏在CVPR展台上展示了该系统,并搭配了一个实体AI世界模型,其相关研究论文《DrivePTS》也已被CVPR收录。
小鹏的领导层从不避讳与特斯拉进行直接比较。他们在2026年春夏之际的一系列表态,标志着其信心的急剧攀升。刘博士在6月的采访中表示,小鹏在中国市场上已经实现了对特斯拉FSD v13的追平,并且追平更新版FSD v14的性能“有望在夏天结束前实现” 。
这些技术主张背后,还有来自最高层的不同寻常的个人承诺。早在2025年12月,CEO何小鹏就立下了一个公开的“性能赌约”,宣称小鹏的VLA系统必须在2026年8月30日前,在中国路况下的体验达到特斯拉FSD v14.2在硅谷的水平 。赌注很明确:如果团队失败,负责人要“裸奔”
。
为了支撑这一叙事,小鹏在2026年5月发布了一段对比视频,邀请两位美国的特斯拉爱好者来到中国。这场精心安排的对比测试,让搭载VLA 2.0的小鹏P7与一辆搭载FSD的特斯拉Model 3在北京的相同路线上进行较量。根据小鹏剪辑的视频,其车辆仅需驾驶员接管2次,而特斯拉则需要7次 。尽管何小鹏在包括2026北京车展在内的多个场合重申,目标是在8月前在中国市场全面超越特斯拉FSD,但独立评测则提醒需保持谨慎。一位在北京测试过VLA 2.0的Electrek编辑评价其性能与FSD v14“相当”,但指出两套系统都仍需驾驶员时刻专注,远未达到完全自动驾驶的水平
。
眼下,这场竞赛仍是一场由大胆架构赌注和更激进口号所定义的高速追逐。小鹏决定从它的驾驶大脑中将语言剔除,是押注“从视觉到行动的最快路径是一条直线”——即便这意味着把字典扔出窗外。
Comments
0 comments