ปัญหานี้ยิ่งชัดขึ้นเมื่อโมเดล AI รุ่นใหม่มีความซับซ้อนมากขึ้น เช่น
Fractile จึงเชื่อว่าในอนาคตอันใกล้ ความหน่วงของ inference อาจเป็นตัวจำกัดการพัฒนา AI มากกว่าความสามารถของโมเดลเอง
ชิป AI ทั่วไป เช่น GPU ของ Nvidia แยก หน่วยประมวลผล ออกจาก หน่วยความจำความเร็วสูง (HBM) ทำให้ข้อมูลต้องวิ่งไปมาระหว่างสองส่วนนี้ตลอดเวลา
Fractile เสนอแนวทางที่ต่างออกไป คือให้การคำนวณเกิดขึ้น ใกล้หรือภายในหน่วยความจำโดยตรง ซึ่งเรียกว่า in‑memory compute
สถาปัตยกรรมนี้มีแนวคิดหลัก เช่น
เมื่อการเคลื่อนย้ายข้อมูลลดลง ระบบจึงมีโอกาสได้ทั้ง
บริษัทระบุว่าระบบของตนอาจทำให้การรัน inference ของโมเดลระดับ frontier เร็วขึ้นได้ถึง 25 เท่า และต้นทุนลดลงเหลือประมาณหนึ่งในสิบ เมื่อเทียบกับฮาร์ดแวร์ปัจจุบัน แม้ตัวเลขเหล่านี้ยังเป็นเป้าหมายของบริษัทและยังไม่มีการทดสอบอิสระยืนยันอย่างเป็นทางการ
รอบระดมทุน Series B มูลค่า 220 ล้านดอลลาร์ ของ Fractile นำโดยกองทุน Accel, Factorial Funds และ Founders Fund พร้อมนักลงทุนเพิ่มเติม เช่น Conviction, Gigascale Capital, O1A Ventures, Felicis, Buckley Ventures และ 8VC
บริษัทมีแผนใช้เงินทุนเพื่อ
Fractile ก่อตั้งในปี 2022 โดยวิศวกรชิปที่ผ่านการฝึกจากมหาวิทยาลัยออกซ์ฟอร์ดชื่อ Walter Goodwin และตั้งเป้านำระบบแรกไปให้ลูกค้าใช้งานภายในช่วงปลายทศวรรษนี้
มีรายงานว่าบริษัท AI อย่าง Anthropic เคยมีการพูดคุยเบื้องต้นเกี่ยวกับการใช้เทคโนโลยีนี้เมื่อฮาร์ดแวร์พร้อมใช้งาน แต่ยังไม่มีการประกาศข้อตกลงเชิงพาณิชย์อย่างเป็นทางการ
หากสถาปัตยกรรมแบบ Fractile สามารถเพิ่มประสิทธิภาพ inference ได้จริง อาจเปิดทางให้แอปพลิเคชัน AI รุ่นใหม่หลายประเภท
ระบบ reasoning สมัยใหม่มักต้องสร้างขั้นตอนการคิดภายในหลายชั้น ก่อนจะให้คำตอบจริง การทำ inference ที่เร็วขึ้นจะทำให้โมเดลสามารถใช้ compute เพิ่มระหว่างการรันจริง หรือที่เรียกว่า test‑time compute ได้มากขึ้น
การสนทนากับ AI ต้องการ latency ต่ำมาก หากการสร้างโทเค็นเร็วขึ้น ผู้ช่วย AI อาจตอบสนองได้ ใกล้เคียงการสนทนาจริงมากขึ้น
AI agent ที่ทำงานอัตโนมัติอาจต้องเรียกเครื่องมือ เขียนโค้ด และคิดซ้ำหลายรอบ กระบวนการเหล่านี้ใช้ โทเค็นจำนวนมหาศาล ทำให้ความเร็ว inference มีความสำคัญมาก
องค์กรที่ให้บริการ AI ในปริมาณสูง เช่น copilots หรือระบบบริการลูกค้า ต้องการทั้ง throughput สูงและต้นทุนต่อโทเค็นต่ำ ฮาร์ดแวร์เฉพาะทางอาจช่วยลดต้นทุนการดำเนินงานได้อย่างมาก
แนวคิดของ Fractile สะท้อนการเปลี่ยนแปลงในอุตสาหกรรม AI เมื่อระบบกำลังก้าวจากงานวิจัยไปสู่การใช้งานจริง ทำให้ ประสิทธิภาพของ inference สำคัญไม่แพ้การเทรนโมเดล
อย่างไรก็ตาม การสร้างสถาปัตยกรรมชิปใหม่ที่สามารถแข่งขันกับระบบ GPU ที่มี ecosystem ใหญ่มากนั้นไม่ใช่เรื่องง่าย และตัวเลขประสิทธิภาพที่บริษัทนำเสนอส่วนใหญ่ยังเป็น เป้าหมายหรือการประเมินภายใน
แม้ยังต้องพิสูจน์อีกมาก แต่ขนาดของเงินลงทุนและความสนใจจากนักลงทุนสะท้อนว่า หลายฝ่ายเชื่อว่าความก้าวหน้าครั้งต่อไปของ AI อาจไม่ได้มาจาก โมเดลที่ใหญ่ขึ้นเท่านั้น แต่อาจมาจากฮาร์ดแวร์ที่รันมันได้เร็วขึ้นอย่างมหาศาล
Comments
0 comments