Venice ถูกสร้างขึ้นบนสถาปัตยกรรมไมโคร Zen 6 และนับเป็นการก้าวกระโดดครั้งสำคัญระหว่างรุ่น ชิปตัวนี้ย้ายไปใช้ซ็อกเก็ต SP7 ใหม่ และมาพร้อมกับการอัปเกรดทางเทคนิคจำนวนมาก
รุ่นท็อปสุดของ Venice มีให้เลือกสูงสุด 256 คอร์ต่อซ็อกเก็ต ซึ่งเพิ่มขึ้นอย่างมากจาก 192 คอร์ของ Turin แบนด์วิธหน่วยความจำก็กระโดดจาก 614 GB/s ไปเป็น 1.6 TB/s หรือเพิ่มขึ้น 2.6 เท่า ต้องขอบคุณคอนโทรลเลอร์หน่วยความจำ DDR5 แบบ 16 แชนแนลใหม่ และการย้ายไปใช้ PCIe 6.0 ที่เพิ่มแบนด์วิธการเชื่อมต่อระหว่าง CPU กับ GPU เป็นสองเท่า
AMD อ้างว่ามีประสิทธิภาพและสมรรถนะการคำนวณที่ดีขึ้นประมาณ 70% เมื่อเทียบกับซีพียู EPYC Turin รุ่นปัจจุบัน พร้อมกับความหนาแน่นของเธรดที่สูงขึ้นประมาณ 1.3 เท่าบนพื้นที่ซ็อกเก็ตเท่าเดิม บริษัทยังได้เปิดตัวบรรจุภัณฑ์ 2.5D แบบ EFB เพื่อเพิ่มแบนด์วิธการเชื่อมต่อระหว่างชิปเล็ต
การผลิตเริ่มต้นขึ้นที่โรงงานของ TSMC ในไต้หวันเมื่อวันที่ 20 พฤษภาคม 2026 และ AMD วางแผนที่จะขยายการผลิตไปยังโรงงานของ TSMC ในรัฐแอริโซนาภายในปี 2026 การจัดส่งถึงมือลูกค้าคาดว่าจะเป็นช่วงครึ่งหลังของปี ซึ่งสอดคล้องกับการใช้งานระบบ Helios แร็คแรกๆ
Helios คือก้าวแรกของ AMD สู่การออกแบบระบบระดับแร็ค (Rack-Scale) เพื่อ AI และ HPC (High-Performance Computing) ซึ่งก่อนหน้านี้ถูกอธิบายว่าเป็นพิมพ์เขียวสำหรับโครงสร้างพื้นฐาน "ระดับ Yotta-scale" โดย Helios ผสานรวมซีพียู Venice, GPU Instinct MI455X และระบบเน็ตเวิร์กกิ้ง Pensando เข้าไว้ในแร็คระบายความร้อนด้วยของเหลวที่ออกแบบมาให้มีความกว้างเป็นสองเท่าของแร็คมาตรฐาน ซึ่งสามารถมอบพลังการคำนวณ AI สูงสุดถึง 2.9 เอกซะฟล็อปส์
Helios หนึ่งแร็คบรรจุตัวเร่งความเร็ว Instinct MI455X จำนวน 72 ตัว เคียงข้างด้วยซีพียูรวม 4,600 คอร์ และหน่วยประมวลผล GPU รวม 18,000 หน่วย เชื่อมต่อกันด้วยหน่วยความจำ HBM4 สูงถึง 31 TB GPU MI455X ใช้ทั้งเทคโนโลยีกระบวนการผลิต 2nm และ 3nm รวมถึงบรรจุภัณฑ์แบบชิปเล็ต 3 มิติ โดยตัวเร่งความเร็วแต่ละตัวให้ประสิทธิภาพการประมวลผลสำหรับการอนุมาน (Inference) แบบ FP4 หนาแน่นอยู่ที่ประมาณ 40 เพตาฟล็อปส์
Meta ได้ประกาศตัวเป็นพันธมิตรรายใหญ่สำหรับการนำไปใช้งานเป็นรายแรกแล้ว ด้วยข้อตกลง 6 กิกะวัตต์ที่ครอบคลุม GPU หลายรุ่น โดยการใช้งานในระดับกิกะวัตต์แรกมีกำหนดเริ่มในครึ่งหลังของปี 2026
เบื้องหลังการประกาศเปิดตัวฮาร์ดแวร์ AMD ได้เสนอข้อโต้แย้งเชิงกลยุทธ์ที่สำคัญยิ่งกว่านั้นคือ Agentic AI กำลังเขียนกฎเศรษฐศาสตร์ของความต้องการ CPU ภายในดาต้าเซ็นเตอร์ใหม่ทั้งหมด
เวิร์กโหลด AI แบบดั้งเดิม ไม่ว่าจะเป็นการอนุมานโมเดลเดี่ยวหรือการฝึกฝนโมเดล มักจะใช้ซีพียูหนึ่งตัวเพื่อควบคุม GPU สี่ ห้า หรือแม้แต่แปดตัว หน้าที่ของซีพียูในการตั้งค่านั้นค่อนข้างเบา แต่เวิร์กโหลดแบบ Agentic AI นั้นแตกต่างโดยพื้นฐาน แทนที่จะเป็นคำสั่งถามตอบครั้งเดียว ระบบ Agentic จะดำเนินการตามขั้นตอนการทำงานที่ซับซ้อน ซึ่งเกี่ยวข้องกับการวางแผน, การใช้เครื่องมือ, การจัดการหน่วยความจำ, การจัดตารางงาน, และการประสานงานระหว่างโมเดลและแหล่งข้อมูลหลายแห่ง ซึ่งการประสานงานทั้งหมดนี้ล้วนทำงานบนซีพียูเอนกประสงค์
Lisa Su ซีอีโอของ AMD กล่าวในระหว่างการรายงานผลประกอบการไตรมาส 1 ปี 2026 ว่า "การอนุมานและ Agentic AI กำลังเพิ่มความต้องการด้านการประมวลผลขั้นพื้นฐาน ขับเคลื่อนทั้งการใช้งานตัวเร่งความเร็วในสเกลที่ใหญ่ขึ้น และการใช้ซีพียูในการประมวลผลที่มากขึ้นอย่างมีนัยสำคัญ"
การวิเคราะห์ภายในของ AMD คาดการณ์ว่า อัตราส่วนของ CPU ต่อ GPU จะถูกบีบอัดจากช่วง 4–5:1 ในปัจจุบัน ให้เหลือประมาณ 1:1 เมื่อ Agentic AI ขยายวงกว้างขึ้น ในบางกรณี Su ยังเสนอว่าสัดส่วนนี้อาจพลิกกลับด้วยซ้ำ นั่นคือมีซีพียูมากกว่า GPU ต่อหนึ่งโหนด หากมีการใช้ Agent อย่างหนาแน่นเพียงพอ
นี่ไม่ใช่แค่แนวคิดของ AMD เพียงเจ้าเดียว Intel ก็ได้แถลงในลักษณะเดียวกัน โดยระบุว่าสัดส่วนดังกล่าวอาจเข้มงวดขึ้นเป็น 1:1 ในสถานการณ์ของ Agentic AI และการวิเคราะห์จาก TrendForce บุคคลที่สามยังคาดการณ์ว่าจำนวนคอร์ซีพียูที่ต้องใช้ต่อกิกะวัตต์ของความจุในดาต้าเซ็นเตอร์จะเพิ่มขึ้นสี่เท่าในยุคของ AI Agent
นัยยะต่อตลาดนั้นสำคัญมาก AMD ได้ปรับเพิ่มการคาดการณ์มูลค่าตลาดรวมของซีพียูเซิร์ฟเวอร์ (TAM) เป็นสองเท่า จากประมาณ 60,000 ล้านดอลลาร์ เป็น 120,000 ล้านดอลลาร์ภายในปี 2030 พร้อมคาดการณ์การเติบโตต่อปีที่ดีกว่า 35% จากเดิมที่เคยคาดไว้ 18% สถานการณ์ขาดแคลนซีพียูเซิร์ฟเวอร์ได้ปรากฏขึ้นแล้วในปี 2026 อันเป็นผลมาจากการสร้างโครงสร้างพื้นฐานสำหรับ Agentic AI และวงจรการปรับปรุงอุปกรณ์องค์กรที่มาชนกับกำลังการผลิตที่มีอยู่อย่างจำกัด
นักลงทุนตอบสนองต่อเรื่องราวความต้องการซีพียูอย่างรวดเร็ว ราคาหุ้นของ AMD พุ่งขึ้น 19% สู่จุดสูงสุดเป็นประวัติการณ์ที่ประมาณ 421 ดอลลาร์ หลังจากรายงานผลประกอบการไตรมาส 1 ปี 2026 ซึ่งรวมถึงการปรับเพิ่ม TAM ของซีพียูเซิร์ฟเวอร์เป็น 120,000 ล้านดอลลาร์ ตลาดตีความว่าการปรับเพิ่ม TAM นี้เป็นหลักฐานของการเปลี่ยนแปลงเชิงโครงสร้างที่ยั่งยืน ไม่ใช่แค่ความต้องการที่พุ่งสูงชั่วคราว
วงการนักวิเคราะห์ในวงกว้างมีมุมมองเชิงบวกต่อแนวคิดนี้ ข้อโต้แย้งที่ว่า Agentic AI ดึงดูดอัตราการใช้ซีพียูที่ใหญ่ขึ้นสำหรับทุกๆ เงินลงทุนด้าน AI (AI Capex) ทำให้หลายฝ่ายในตลาดต้องปรับเพิ่มประมาณการและราคาเป้าหมาย แม้จะไม่มีรายละเอียดบันทึกเฉพาะจาก Barclays และ UBS ในหลักฐานต้นฉบับ แต่ปฏิกิริยาตลาดโดยรวมเป็นบวกอย่างชัดเจน โดยอ้างอิงถึงการบีบอัดสัดส่วนของ CPU ต่อ GPU เป็นตัวเร่งปฏิกิริยาหลัก
บทบาทของ Supermicro ที่งาน Computex 2026 นั้นเป็นมากกว่าการแสดงสินค้าของพันธมิตรทั่วไป Supermicro คือหนึ่งในพันธมิตรรายแรกๆ ที่นำ Helios ออกสู่ตลาด และใช้บูธในงาน Computex เพื่อสาธิตการทำงานของแร็คความกว้างสองเท่า 72-GPU ที่สร้างบนสถาปัตยกรรม Data Center Building Block Solutions ของตน
ระบบดังกล่าวรวม GPU Instinct MI455X, ซีพียู EPYC Venice เจน 6 และ SmartNIC/DPU ของ Pensando เข้าด้วยกัน ภายใต้สแต็กซอฟต์แวร์ ROCm แบบเปิดของ AMD โดยมีเป้าหมายเพื่อรองรับเวิร์กโหลดการฝึกฝน AI ขนาดใหญ่, การอนุมาน, Sovereign AI, และการปรับแต่ง LLM (Large Language Models) ด้วยความสามารถในการขยายขีดความสามารถแบบโมดูล (Modular) จากแร็คเดียวไปจนถึงการใช้งานแบบคลัสเตอร์เต็มรูปแบบ
การสาธิตครั้งนี้สร้างข้อความที่ชัดเจนว่า Helios ไม่ใช่แพลตฟอร์มที่มีแต่ในกระดาษ แต่เป็นระบบที่ใช้งานได้จริง, มีการสนับสนุนจากระบบนิเวศโดยผู้ผลิต OEM รายใหญ่ และถูกวางตำแหน่งเพื่อแข่งขันในสัญญาโครงสร้างพื้นฐาน AI สำหรับผู้ให้บริการคลาวด์ขนาดใหญ่ (Hyperscale) และ NeoCloud ตั้งแต่ช่วงปลายปีนี้เป็นต้นไป
งาน Advancing AI ซึ่งเป็นอีเวนต์ประจำฤดูใบไม้ร่วงของ AMD คือเวทีตามธรรมชาติสำหรับการเปิดเผยข้อมูลระลอกสำคัญถัดไป ด้วยที่ Venice เข้าสู่การผลิตแล้ว และการใช้งาน Helios มีกำหนดในครึ่งหลังของปี 2026 สิ่งที่หลายฝ่ายรอคอยมากที่สุด ได้แก่ สเปกและราคาสุดท้ายของ Venice, รายละเอียดทางสถาปัตยกรรมที่ลึกขึ้นของ GPU MI450X และ MI455X, ลูกค้า Helios รายอื่นนอกเหนือจาก Meta, และการเปิดเผยโฉมแรกของซีพียู EPYC เจนถัดไปที่มีชื่อรหัสว่า 'Verano' ซึ่งยืนยันว่าจะมาในปี 2027
นอกจากนี้ยังมีความเป็นไปได้ที่จะมีการเปิดเผยสถาปัตยกรรมอ้างอิงของ Agentic AI ที่ขยายเพิ่มเติม โดยให้รายละเอียดมากขึ้นว่า AMD คาดว่าแร็คของซีพียูเซิร์ฟเวอร์จะบูรณาการกับโครงสร้างพื้นฐานของ GPU อย่างไร เมื่ออุตสาหกรรมกำลังมุ่งหน้าไปสู่สัดส่วนของ CPU ต่อ GPU ที่หนาแน่นยิ่งขึ้น
ข้อความของ AMD ในงาน Computex 2026 นั้นชัดเจน: บริษัทเชื่อว่าดาต้าเซ็นเตอร์กำลังจะใช้ซีพียูในอัตราเร่งที่ไม่มีใครคาดการณ์ไว้มาก่อน Venice และ Helios ถูกสร้างขึ้นมาเพื่อรองรับช่วงเวลาสำคัญนั้น
Comments
0 comments