คำตอบเผยแพร่แล้ว2 เดือนที่ผ่านมาLast edited เดือนที่แล้ว18 แหล่งที่มา

เดิมพัน 220 ล้านดอลลาร์ของ Fractile เพื่อแก้คอขวด AI ที่เรียกว่า ‘Inference’

Fractile จากสหราชอาณาจักรระดมทุน Series B มูลค่า 220 ล้านดอลลาร์ เพื่อสร้างชิป AI ที่ออกแบบมาสำหรับงาน inference ซึ่งกำลังกลายเป็นคอขวดสำคัญของระบบ AI สมัยใหม่ สถาปัตยกรรมของบริษัทรวมหน่วยประมวลผลและหน่วยความจำไว้บนชิปเดียว และทำการคำนวณภายในหน่วยความจำเพื่อลดการย้ายข้อมูลที่ทำให้ระบบช้าลง หากเทคโนโลยีนี้ทำได้ตามเป้...

ค้นหาและตรวจสอบข้อเท็จจริงด้วย Studio Global AI ดูหน้าที่กำลังมาแรงเพิ่มเติม

Concept illustration of AI inference hardware integrating memory and compute — How is UK AI chip startup Fractile addressing the growing AI inference bottleneck, what did its $220M Series B funding involve, why does theFractile is developing AI chips designed to perform computation directly within memory to reduce inference latency and cost.
AI พรอมต์
Create a landscape editorial hero image for this Studio Global article: How is UK AI chip startup Fractile addressing the growing AI inference bottleneck, what did its $220M Series B funding involve, why does the. Article summary: Fractile is attacking the inference bottleneck with specialized AI inference hardware that moves compute much closer to memory, rather than relying on conventional GPU designs that shuttle model data between separate com. Topic tags: general, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# Fractile United Kingdom ## Why Fractile matters #### Summary Fractile has raised $220 million in a Series B funding round led by Accel, Factorial Funds, and Founders Fund, wi" source context "Fractile raised $200M | AI Chips | MapCo" Reference image 2: visual subject "Founded in 2022, Fractile aims to address t
openai.com

ช่วงหลายปีที่ผ่านมา บริษัทเทคโนโลยีจำนวนมากแข่งขันกันพัฒนา โมเดล AI ที่ใหญ่และฉลาดขึ้นเรื่อย ๆ แต่ตอนนี้อุตสาหกรรมเริ่มเจอปัญหาใหม่ที่สำคัญไม่แพ้กัน นั่นคือ การนำโมเดลเหล่านั้นไปใช้งานจริงให้เร็วและคุ้มค่า

สตาร์ตอัปจากลอนดอนชื่อ Fractile เชื่อว่าปัญหานี้คือคอขวดสำคัญของยุค AI และกำลังพัฒนาชิปเฉพาะทางเพื่อแก้ไข โดยล่าสุดบริษัทระดมทุนได้ 220 ล้านดอลลาร์ในรอบ Series B เพื่อเร่งสร้างฮาร์ดแวร์สำหรับงาน AI inference หรือขั้นตอนที่โมเดลสร้างคำตอบให้ผู้ใช้จริง

แนวคิดหลักของ Fractile คือ อนาคตของ AI อาจไม่ได้ถูกจำกัดด้วยการสร้างโมเดลที่เก่งขึ้นเพียงอย่างเดียว แต่ถูกจำกัดด้วย ความเร็วและต้นทุนในการสร้างผลลัพธ์จากโมเดลเหล่านั้นในระดับมหาศาล

ทำไม “Inference” ถึงกลายเป็นคอขวดของ AI

โครงสร้างพื้นฐาน AI ส่วนใหญ่ในปัจจุบันถูกออกแบบมาเพื่อ การเทรนโมเดล (training) ซึ่งเป็นกระบวนการที่ต้องใช้พลังประมวลผลสูงมาก GPU จึงถูกใช้อย่างแพร่หลายเพราะสามารถคำนวณแบบขนานได้ดี

แต่เมื่อโมเดลถูกนำไปใช้งานจริง ระบบจะเข้าสู่ขั้นตอน inference ซึ่งต้องสร้างคำตอบทีละโทเค็นตามคำสั่งของผู้ใช้

ในขั้นตอนนี้ ปัญหาใหญ่ไม่ได้อยู่ที่พลังคำนวณเพียงอย่างเดียว แต่เป็นเรื่องของ

แบนด์วิดท์ของหน่วยความจำ
ความหน่วง (latency) ในการเข้าถึงข้อมูล

โมเดลขนาดใหญ่ต้องอ่าน ค่าน้ำหนัก (weights) และข้อมูลภายในจำนวนมหาศาลซ้ำแล้วซ้ำเล่า หากฮาร์ดแวร์ไม่สามารถเคลื่อนย้ายข้อมูลเหล่านี้ได้เร็วพอ การเพิ่มพลังประมวลผลอย่างเดียวก็ไม่ช่วยให้ระบบเร็วขึ้นมากนัก

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

ค้นหาและตรวจสอบข้อเท็จจริงด้วย Studio Global AI

คนยังถาม

คำตอบสั้น ๆ สำหรับ "เดิมพัน 220 ล้านดอลลาร์ของ Fractile เพื่อแก้คอขวด AI ที่เรียกว่า ‘Inference’" คืออะไร

Fractile จากสหราชอาณาจักรระดมทุน Series B มูลค่า 220 ล้านดอลลาร์ เพื่อสร้างชิป AI ที่ออกแบบมาสำหรับงาน inference ซึ่งกำลังกลายเป็นคอขวดสำคัญของระบบ AI สมัยใหม่

ประเด็นสำคัญที่ต้องตรวจสอบก่อนคืออะไร?

ฉันควรทำอย่างไรต่อไปในทางปฏิบัติ?

หากเทคโนโลยีนี้ทำได้ตามเป้า อาจทำให้โมเดล reasoning ขนาดใหญ่ ผู้ช่วย AI แบบเรียลไทม์ และระบบ AI อัตโนมัติทำงานได้เร็วขึ้นและต้นทุนถูกลงมาก

เดิมพัน 220 ล้านดอลลาร์ของ Fractile เพื่อแก้คอขวด AI ที่เรียกว่า ‘Inference’

ทำไม “Inference” ถึงกลายเป็นคอขวดของ AI

Search, cite, and publish your own answer

คนยังถาม

คำตอบสั้น ๆ สำหรับ "เดิมพัน 220 ล้านดอลลาร์ของ Fractile เพื่อแก้คอขวด AI ที่เรียกว่า ‘Inference’" คืออะไร

ประเด็นสำคัญที่ต้องตรวจสอบก่อนคืออะไร?

ฉันควรทำอย่างไรต่อไปในทางปฏิบัติ?

แหล่งที่มา

แนวทางของ Fractile: ให้การคำนวณเกิดขึ้น “ในหน่วยความจำ”

เงินทุน 220 ล้านดอลลาร์จะถูกใช้ทำอะไร

งาน AI แบบใหม่ที่อาจเกิดขึ้นได้หาก inference เร็วขึ้น

โมเดล reasoning ขนาดใหญ่

ผู้ช่วย AI แบบเรียลไทม์

ระบบ AI แบบ Agent

AI ระดับองค์กร

คำถามสำคัญ: จะทำได้จริงในระดับอุตสาหกรรมหรือไม่