แนวคิดหลักที่ผลักดันให้เกิดการลงทุนนี้ ไม่ใช่เพราะพวกเขากำลังสร้างคู่แข่ง GPU ตัวใหม่ แต่เป็นเพราะ XCENA วางตำแหน่งผลิตภัณฑ์แรกของบริษัทที่ชื่อว่า MX1 ให้เป็นอุปกรณ์ในหมวดหมู่ที่แตกต่างไปจากเดิมอย่างสิ้นเชิง นั่นคือ 'หน่วยความจำเชิงคำนวณ' (Computational Memory) ที่รวมเอาพลังในการประมวลผลเข้าไปไว้ในชั้นหน่วยความจำนั่นเอง
ในสถาปัตยกรรมเซิร์ฟเวอร์แบบดั้งเดิม เมื่อข้อมูลจำเป็นต้องถูกประมวลผล ข้อมูลนั้นจะต้องเดินทางไป-กลับระหว่าง DRAM และ CPU หรือ GPU ซึ่งมีต้นทุนที่สูงมาก สำหรับเวิร์กโหลด AI อย่างการอนุมานขนาดใหญ่ การวิเคราะห์ข้อมูลแบบเรียลไทม์ และการสืบค้นฐานข้อมูลเวกเตอร์ การเคลื่อนย้ายข้อมูลตลอดเวลาเช่นนี้ก่อให้เกิดความหน่วง ใช้พลังงานมาก และสร้างปัญหาที่รู้จักกันดีในชื่อ 'กำแพงหน่วยความจำ' (Memory Wall)
ข้อมูลเชิงลึกในการก่อตั้งของ XCENA ก็คือ การทำงานที่ต้องใช้ข้อมูลมหาศาลเหล่านี้หลายงานไม่ได้จำเป็นต้องใช้พลังการประมวลผลแบบขนานเฉพาะทางของ GPU เลยด้วยซ้ำ งานประจำอย่างการกรอง ค้นหา และวิเคราะห์ข้อมูล สามารถจัดการได้ด้วยคอร์ประมวลผลที่เรียบง่ายกว่าและประหยัดพลังงานกว่า หากนำมันไปวางไว้ข้างๆ ชิปหน่วยความจำ วิธีนี้จะช่วยหลีกเลี่ยงการเดินทางไป-กลับของข้อมูลได้อย่างสิ้นเชิง แนวทางนี้เรียกว่า Near-Data Processing (NDP) หรือการประมวลผลใกล้ข้อมูล ซึ่งมีเป้าหมายเพื่อแบ่งเบาภาระของ CPU มากกว่าที่จะเข้าไปแทนที่
MX1 ถูกอธิบายว่าเป็นผลิตภัณฑ์ Computational Memory ตัวแรกของโลกที่รองรับทั้ง PCIe 6.0 และมาตรฐาน CXL 3.2 CXL หรือ Compute Express Link เป็นเทคโนโลยีที่เชื่อมต่อระหว่างหน่วยประมวลผลและหน่วยความจำด้วยความเร็วสูงและความหน่วงต่ำ เสมือนเป็นช่องทางด่วนเฉพาะ ทำให้มันเป็นกระดูกสันหลังที่สมบูรณ์แบบสำหรับอุปกรณ์ที่ถูกออกแบบมาให้อยู่ในระดับหน่วยความจำ
แทนที่จะเป็นตัวเร่งความเร็ว (Accelerator) แบบเสาหิน MX1 คืออุปกรณ์ที่อัดแน่นไปด้วยคอร์ RISC-V แบบปรับแต่งได้นับพันตัว เอกสารของ XCENA ระบุว่ามันคือ "คอร์ RISC-V ความถี่ 1.4GHz นับพันตัว" ที่ผนวกรวมเข้าไปในระบบย่อยของหน่วยความจำโดยตรง คอร์เหล่านี้สามารถดำเนินการคล้ายฐานข้อมูล (ผ่านไลบรารีซอฟต์แวร์ XFLARE ของ XCENA) ณ จุดที่ข้อมูลอยู่ โดยไม่ต้องย้ายข้อมูลไปให้ CPU หลักประมวลผล
แนวทางทางเทคนิคของ XCENA ใช้เส้นทางการขยายที่แยกออกไปผ่าน SSD บน PCIe 6.0 ทำให้เกิดสิ่งที่บริษัทเรียกว่า "Infinite Memory" หรือหน่วยความจำไร้ขีดจำกัด ฟีเจอร์นี้สามารถขยายพูลหน่วยความจำที่เครื่องแม่ข่ายเข้าถึงได้ในทางทฤษฎีให้อยู่ในระดับเพตะไบต์ (Petabyte) โดยใช้ SSD ที่เชื่อมต่อผ่าน CXL ทำให้แอปพลิเคชันสามารถจัดการชุดข้อมูลขนาดใหญ่ขึ้นได้ โดยมีความหน่วงที่ต่ำกว่าการเข้าถึงที่เก็บข้อมูลแบบเดิม
โรดแมปของบริษัทเผยให้เห็นแผนการทำซ้ำอย่างรวดเร็ว:
การ์ดเหล่านี้รองรับ DDR5 DIMM สูงสุด 256GB เพื่อความจุ 1TB และใช้ตัวควบคุมหน่วยความจำ DDR5-8400 ในงาน FMS 2025 (Future of Memory and Storage) MX1 ยังได้รับรางวัลเทคโนโลยี Computational Memory ที่ล้ำสมัยที่สุด
สิ่งสำคัญคือต้องเข้าใจว่า XCENA กำลังทำอะไรที่ไม่ใช่ พวกเขาไม่ได้ออกแบบชิปเพื่อเทรนโมเดล Foundation Model ขนาดใหญ่ให้เร็วกว่า H100 หรือ B200 ของ Nvidia MX1 ถูกวางตำแหน่งให้เป็น Co-processor สำหรับงานที่ใช้ข้อมูลหนักหน่วง โดยทำงานร่วมกับ CPU และ GPU ที่มีอยู่ แทนที่จะเข้าไปแทนที่
สำหรับการอนุมาน AI ที่โมเดลต้องสแกนพูลหน่วยความจำขนาดใหญ่ซ้ำๆ หรือสำหรับเวิร์กโหลดที่ต้องใช้ฐานข้อมูลหนักๆ เช่น การวิเคราะห์แบบเรียลไทม์และการค้นหาเวกเตอร์ กลยุทธ์ของ XCENA คือการลดภาระของหน่วยประมวลผลหลัก โดยจัดการส่วนที่ใช้ 'หน่วยความจำหนัก' ให้เสร็จที่ต้นทาง เป้าหมายคือการสร้างดาต้าเซ็นเตอร์ที่ข้อมูลทุกชิ้นไม่จำเป็นต้องเดินทางผ่านหน่วยประมวลผลที่แพงและกินไฟมากที่สุดเสมอไป
มูลค่ากิจการ 570 ล้านดอลลาร์สหรัฐฯ ที่มากับการระดมทุนรอบ Series B ครั้งนี้ ส่งสัญญาณถึงความเชื่อมั่นอย่างแรงกล้าของนักลงทุนว่า การประมวลผลที่เน้นหน่วยความจำเป็นศูนย์กลาง (Memory-Centric Computing) จะมีบทบาทสำคัญในโครงสร้างพื้นฐานของ AI ขณะนี้ MX1 กำลังอยู่ในขั้นการสำรวจความเป็นไปได้กับพาร์ทเนอร์บางรายเพื่อตรวจสอบประสิทธิภาพที่เพิ่มขึ้นจริงในระดับระบบและความคุ้มค่า
อย่างไรก็ตาม เรื่องราวการพิสูจน์ยังคงถูกเขียนต่อไป รางวัลจาก FMS และสเปกที่รายงานออกมาดีนั้นเป็นสัญญาณที่น่าสนใจ แต่การนำไปใช้จริงในวงกว้างและผลการทดสอบอิสระต่างหากคือบททดสอบที่แท้จริงสำหรับเทคโนโลยีที่เสนอให้ปรับโครงสร้างชิ้นส่วนพื้นฐานของระบบเซิร์ฟเวอร์ใหม่ทั้งหมด สิ่งที่ XCENA เดิมพันก็คือ อุตสาหกรรม AI พร้อมแล้วที่จะหยุดเคลื่อนย้ายข้อมูล และเริ่มประมวลผลมัน ณ จุดที่มันอยู่
Comments
0 comments