ความต่างนี้สำคัญมาก เพราะ V4 preview น่าสนใจในเชิงสถาปัตยกรรม ประสิทธิภาพ และศักยภาพของบริบทยาว ขณะที่ V4 Pro ถูกจับตาในเชิงคะแนน อันดับ และการตัดสินใจว่าจะนำไปใช้หรือไม่
Reuters รายงานว่าปฏิกิริยาตลาดต่อโมเดล preview รุ่นใหม่ของ DeepSeek ค่อนข้างนิ่งกว่าที่หลายคนคาด Lian Jye Su หัวหน้านักวิเคราะห์ของ Omdia อธิบายว่าการเปิดตัวครั้งนี้เดินไปตามเส้นทางที่ “ค่อนข้างคาดเดาได้” เพราะความก้าวหน้าเรื่องสถาปัตยกรรมโมเดลและประสิทธิภาพเป็นสิ่งที่ทั้งภาคอุตสาหกรรมและวงวิชาการสำรวจอย่างกว้างขวางอยู่แล้ว
พูดง่าย ๆ คือ V4 ไม่ได้เดินบนเส้นทางที่ไม่มีใครเคยเห็นมาก่อน แต่เป็นการผลักดันต่อในสนามที่ทุกคนกำลังวิ่งเร็วอยู่แล้ว Reuters ยังระบุว่าคู่แข่งอย่าง Kimi และ Qwen กำลังลดช่องว่างลง ทำให้ DeepSeek สร้างภาพความเป็นผู้นำแบบขาดลอยจากการเปิดตัวครั้งเดียวได้ยากขึ้น
นี่จึงไม่ใช่เรื่องของ “ไม่มีพัฒนา” แต่เป็นเรื่องของตลาดที่โตขึ้น แออัดขึ้น และตื่นเต้นยากขึ้น
ด้าน benchmark มีข้อมูลที่ช่วยให้ภาพชัดขึ้น Reuters อ้าง Artificial Analysis ว่า DeepSeek-V4 Pro ดีขึ้นจากรุ่นก่อนอย่างมีนัยสำคัญ แต่โดยรวมยังอยู่ในกลุ่มโมเดลแบบเปิดน้ำหนักชั้นนำ มากกว่าจะเป็นรุ่นที่แซงคู่แข่งอย่างชัดเจน
SCMP อ้างคะแนนจาก Artificial Analysis Intelligence Index โดยระบุว่า V4 Pro ได้ 52 คะแนน สูงกว่า V3.2 รุ่นก่อนหน้า แต่ต่ำกว่า Kimi K2.6 ที่ได้ 54 คะแนน ขณะที่โมเดลปิดจากสหรัฐฯ ที่รายงานเดียวกันยกมา ได้แก่ OpenAI GPT-5.5 ได้ 60 คะแนน ส่วน Anthropic Claude Opus และ Google Gemini 3.1 Pro ได้ 57 คะแนนเท่ากัน
| โมเดล | คะแนนใน Artificial Analysis Intelligence Index |
|---|---|
| OpenAI GPT-5.5 | 60 |
| Anthropic Claude Opus | 57 |
| Google Gemini 3.1 Pro | 57 |
| Kimi K2.6 | 54 |
| DeepSeek V4 Pro | 52 |
นี่คือเหตุผลที่เสียงประเมินแตกเป็นสองทาง หากคาดหวังว่า DeepSeek V4 Pro จะเปิดตัวแล้วขึ้นอันดับหนึ่งทันที คำตอบคือยังไม่ถึงจุดนั้น แต่ถ้าดูว่า DeepSeek ยังรักษาตำแหน่งในกลุ่มนำของโมเดลแบบเปิดน้ำหนักได้หรือไม่ คำตอบคือยังควรถูกนำไปประเมินอย่างจริงจัง
จุดเน้นของ MIT Technology Review ต่อ V4 preview ไม่ใช่การขึ้นอันดับในตารางคะแนน แต่คือประสิทธิภาพและความสามารถในการรองรับบริบทที่ยาวขึ้น รายงานระบุว่า V4 preview มีประสิทธิภาพกว่ารุ่นก่อน และรับพรอมป์ได้ยาวกว่า เพราะการออกแบบใหม่ช่วยให้จัดการข้อความจำนวนมากได้ดีขึ้น
สำหรับคนทำผลิตภัณฑ์ AI ประเด็นนี้อาจสำคัญกว่าการชนะ benchmark บางรายการด้วยซ้ำ เพราะงานจริงจำนวนมากไม่ได้มีแค่คำถามสั้น ๆ แต่เกี่ยวข้องกับเอกสารยาว ฐานความรู้ขององค์กร โค้ดทั้ง repository งานวิจัยหลายไฟล์ หรือสัญญาที่ต้องอ่านแบบไม่หลุดบริบท
อย่างไรก็ตาม คำว่า “ประสิทธิภาพดีขึ้น” จะมีความหมายต่อธุรกิจจริงก็ต่อเมื่อแปลงออกมาเป็นตัวชี้วัดที่จับต้องได้ เช่น latency ที่ลดลง throughput ที่สูงขึ้น ต้นทุนต่อคำตอบที่ต่ำลง จำนวนผู้ใช้พร้อมกันที่รองรับได้มากขึ้น หรือข้อจำกัดในการ deploy ที่ผ่อนคลายลง
ความหมายของ V4 ไม่ได้หยุดอยู่ที่ตัวโมเดล MIT Technology Review มองว่าการเปิดตัว V4 เป็นผลบวกต่อผู้ผลิตชิปจีน ซึ่งสะท้อนว่าภายนอกไม่ได้มองโมเดลนี้แค่ในฐานะซอฟต์แวร์ AI แต่เชื่อมโยงกับโครงสร้างพื้นฐานและห่วงโซ่อุปทานด้านฮาร์ดแวร์ด้วย
ในอีกด้าน SCMP ระบุว่าคะแนนของ V4 Pro สะท้อนความท้าทายที่ DeepSeek และอุตสาหกรรม AI จีนเผชิญในการไล่ตามสหรัฐฯ ทั้งการแข่งขันที่รุนแรงขึ้นในประเทศและต่างประเทศ รวมถึงข้อจำกัดด้านกำลังประมวลผลที่ยังมีอยู่
ดังนั้น V4 ไม่ได้พิสูจน์ว่า DeepSeek แซงโมเดลปิดระดับบนของสหรัฐฯ ไปแล้ว แต่แสดงให้เห็นว่า DeepSeek ยังเดินหน้าปรับปรุงประสิทธิภาพ ความสามารถ และความพร้อมใช้งานของโมเดล ภายใต้สนามแข่งขันที่ยากขึ้นและทรัพยากรประมวลผลที่ไม่ไร้ขีดจำกัด
การดูคะแนนรวมอย่างเดียวหรือดูว่าตลาดตื่นเต้นแค่ไหน ยังไม่พอสำหรับการตัดสินใจนำโมเดลไปใช้จริง สิ่งที่ควรประเมินมีอย่างน้อย 5 ข้อ
DeepSeek V4 ไม่ว้าว เพราะความคาดหวังของตลาดสูงขึ้นมาก แนวทางการเพิ่มประสิทธิภาพและปรับสถาปัตยกรรมกลายเป็นเรื่องที่คาดเดาได้มากขึ้น และคู่แข่งอย่าง Kimi, Qwen รวมถึงโมเดลปิดชั้นนำทำให้สนามแข่งขันแน่นกว่าเดิม
แต่ V4 ยังน่าจับตา เพราะ V4 preview มีประเด็นเรื่องประสิทธิภาพและบริบทยาว ส่วน V4 Pro แสดงการปรับปรุงจากรุ่นก่อน และภาพรวมยังสะท้อนว่า DeepSeek เดินหน้าต่อในสภาพแวดล้อมที่มีทั้งการแข่งขันสูงและข้อจำกัดด้านกำลังประมวลผล
พูดให้สั้นที่สุด DeepSeek V4 อาจไม่ใช่การพลิกกระดาน AI ในชั่วข้ามคืน แต่เป็นสัญญาณของความสุกงอมทางวิศวกรรม และสำหรับคนที่ต้องนำ AI ไปใส่ในผลิตภัณฑ์จริง ความเสถียร ความคุ้มค่า และความ deploy ได้จริง มักมีค่ามากกว่าเสียงฮือฮาช่วงเปิดตัว
Comments
0 comments