หัวใจสำคัญของการปรากฏตัวของ XPeng ในงาน CVPR 2026 คือการเปิดตัวโมเดล VLA 2.0 (Vision-Language-Action) เจเนอเรชันที่สองอย่างเป็นทางการ สถาปัตยกรรมนี้ถือเป็นการออกนอกเส้นทางเดิมอย่างสิ้นเชิงจากวิธีที่ระบบ AI จำนวนมาก รวมถึงโมเดลเจเนอเรชันแรกของ XPeng ใช้ในการจัดการงานขับขี่ ,
ในกระบวนการแบบดั้งเดิม ระบบจะทำงานเป็นลำดับขั้นตอน: รถยนต์มองเห็นถนน → แปลผลการรับรู้ทางภาพให้เป็นโทเคนที่คล้ายกับภาษา → จากนั้นจึงใช้เหตุผลจากโทเคนภาษาเหล่านั้นเพื่อสร้างคำสั่งในการขับขี่ ดร. หลิว อธิบายว่าขั้นตอนกลางนี้คือจุดอ่อนสำคัญ โดยกล่าวอย่างตรงไปตรงมาว่า "ภาษาคือยาพิษ" (Language is poison) สำหรับการขับขี่แบบเรียลไทม์ ,
เหตุผลของเขาคือ โทเคนภาษาทำให้เกิดความหน่วงแฝง (Latency) โดยธรรมชาติ และยังนำ "สัญญาณรบกวน" เชิงความหมายที่ไม่เกี่ยวข้องเข้ามาสู่กระบวนการที่ต้องการการตอบสนองในระดับมิลลิวินาที
เพื่อขจัดปัญหานี้ โมเดล VLA 2.0 ได้นำแนวทางที่บริษัทเรียกว่า "เส้นทางจากภาพ-โทเคนแฝง-แอคชั่น" (Vision-Implicit Token-Action) มาใช้ ซึ่งช่วยให้สามารถสร้างคำสั่งขับขี่จากข้อมูลภาพดิบได้โดยตรงแบบครบวงจร โดยปราศจากการแปลงเป็นภาษาใดๆ ระหว่างทาง ,
แม้ว่าระบบจะยังคงรับภาษาในรูปแบบของข้อมูลขาเข้าได้ เช่น คำสั่งนำทางของผู้ขับขี่หรือคำสั่งเสียง แต่ระบบจะไม่สร้างโทเคนภาษาของตัวเองขึ้นมาเป็นผลลัพธ์ภายในเลยในระหว่างการขับขี่
XPeng ได้จัดแสดงระบบนี้ที่บูธในงาน CVPR ควบคู่ไปกับโมเดลโลกทางกายภาพ (Physical AI World Model) และมีรายงานวิจัยที่เกี่ยวข้องในชื่อ DrivePTS ซึ่งได้รับการตอบรับให้ตีพิมพ์ในงานประชุมดังกล่าวด้วย
ผู้นำของ XPeng ไม่อายที่จะเปรียบเทียบโดยตรงกับ Tesla การอ้างสิทธิ์ของพวกเขาในช่วงฤดูใบไม้ผลิและฤดูร้อนปี 2026 แสดงถึงความมั่นใจที่พุ่งสูงขึ้นอย่างก้าวกระโดด ดร. หลิวกล่าวในการให้สัมภาษณ์เมื่อเดือนมิถุนายนว่า XPeng สามารถ ทำประสิทธิภาพได้ทัดเทียมกับ Tesla's FSD v13 ในประเทศจีนแล้ว และการเทียบเท่ากับประสิทธิภาพของ FSD v14 ที่ใหม่กว่านั้น "อยู่ใกล้แค่เอื้อมก่อนสิ้นสุดฤดูร้อนนี้" ,
คำกล่าวอ้างทางเทคนิคเหล่านี้ได้รับการหนุนหลังจากความมุ่งมั่นส่วนตัวที่ไม่ธรรมดาจากผู้บริหารระดับสูง ในเดือนธันวาคม 2025 คุณเหอ เสี่ยวเผิง (He Xiaopeng) ซีอีโอของ XPeng ได้ตั้ง "การเดิมพันด้วยประสิทธิภาพ" ต่อสาธารณะ โดยประกาศว่าระบบ VLA ของ XPeng จะต้องมอบประสบการณ์การขับขี่บนท้องถนนให้เทียบเท่ากับ Tesla's FSD v14.2 ในซิลิคอนวัลเลย์ให้ได้ภายในวันที่ 30 สิงหาคม 2026 ,
เดิมพันครั้งนี้ระบุไว้อย่างชัดเจนว่า: หากทีมล้มเหลว ผู้รับผิดชอบจะต้อง "วิ่งแก้ผ้า"
,
เพื่อสนับสนุนเรื่องราวของตนเอง XPeng ได้เผยแพร่วิดีโอเปรียบเทียบการแข่งขันแบบแมน-ทู-แมนในเดือนพฤษภาคม 2026 โดยการนำแฟนพันธุ์แท้ Tesla ชาวอเมริกันสองคนมาที่จีน การเปรียบเทียบที่จัดฉากขึ้นนี้เป็นการดวลกันระหว่าง XPeng P7 ที่ใช้ระบบ VLA 2.0 กับ Tesla Model 3 ที่ใช้ระบบ FSD บนเส้นทางในกรุงปักกิ่งที่เหมือนกัน ตามวิดีโอที่ XPeng ตัดต่อเอง ยานพาหนะของตนต้องให้ผู้ขับขี่เข้าควบคุมเพียง 2 ครั้ง เทียบกับ Tesla ที่ต้องควบคุมถึง 7 ครั้ง ,
แม้ว่าคุณเหอ เสี่ยวเผิง จะย้ำในหลายวาระ รวมถึงในงาน ออโต้ ไชน่า 2026 ว่าเป้าหมายคือการเอาชนะ Tesla's FSD ในตลาดจีนอย่างสมบูรณ์แบบภายในเดือนสิงหาคมนี้ แต่บทวิจารณ์อิสระก็ยังแนะนำให้ใช้วิจารณญาณ บรรณาธิการของ Electrek ซึ่งได้ทดสอบ VLA 2.0 ในกรุงปักกิ่งอธิบายว่าสมรรถนะของระบบ "เทียบเคียงได้" กับ FSD v14 แต่ให้ข้อสังเกตว่าระบบทั้งสองยังคงต้องการสมาธิจากผู้ขับขี่อย่างต่อเนื่องและยังห่างไกลจากคำว่าอัตโนมัติเต็มรูปแบบ
,
ณ เวลานี้ การแข่งขันยังคงเป็นการไล่ล่าด้วยความเร็วสูงซึ่งนิยามด้วยการเดิมพันทางสถาปัตยกรรมที่ห้าวหาญและการอ้างสิทธิ์ที่ห้าวหาญยิ่งกว่า การตัดสินใจของ XPeng ที่จะออกแบบ "ภาษา" ออกจากสมองกลสำหรับการขับขี่ของตนคือการพนันที่คำนวณมาอย่างดีว่าเส้นทางที่เร็วที่สุดจากภาพไปสู่แอคชั่นคือเส้นทางตรง แม้ว่านั่นจะหมายถึงการทิ้งพจนานุกรมออกไปนอกหน้าต่างก็ตาม
Comments
0 comments