วิศวกรหันมาใช้โครงข่ายประสาทเทียมเชิงลึกเป็นตัวแทนที่รวดเร็วสำหรับตัวแก้ปัญหาแม่เหล็กไฟฟ้าแบบคลาสสิก แนวคิดนั้นเรียบง่าย: ฝึกสอนเครือข่ายด้วยคู่ข้อมูล (รูปทรงเรขาคณิต, การตอบสนองทางแสง) จำนวนมาก จากนั้นใช้มันทำนายคุณสมบัติของการออกแบบใหม่ในหน่วยมิลลิวินาที แทนที่จะเป็นนาทีหรือชั่วโมง ข้อเสียคือ โครงข่ายประสาทเทียมมาตรฐานมองว่านี่คือแบบฝึกหัดการจับคู่รูปแบบล้วนๆ พวกมันไม่มีความรู้ intrinsic เกี่ยวกับฟิสิกส์ ดังนั้นจึงต้องการชุดข้อมูลขนาดมหึมาเพื่อเรียนรู้แม้กระทั่งพฤติกรรมแม่เหล็กไฟฟ้าพื้นฐาน — การจำลอง 40,000 ครั้งที่กินเวลา 30 วันมักเป็นขั้นต่ำสุด และถึงอย่างนั้น ตัวแบบก็ยังอาจสร้างผลลัพธ์ที่เป็นไปไม่ได้ทางกายภาพออกมาได้
Philippe Tassin ศาสตราจารย์ประจำภาควิชาฟิสิกส์ที่ Chalmers และ Viktor Lilja นักศึกษาปริญญาเอก ใช้แนวทางที่แตกต่างโดยพื้นฐาน แทนที่จะปล่อยให้โครงข่ายประสาทเทียมที่ว่างเปล่าเรียนรู้ฟิสิกส์จากตัวอย่างเพียงอย่างเดียว พวกเขาให้ "การศึกษาฟิสิกส์ขั้นพื้นฐาน" แก่มัน โดยฮาร์ดโค้ดข้อจำกัดที่ได้มาจากสมการแมกซ์เวลล์เข้าไปในโครงสร้างของเครือข่ายโดยตรง
กรอบการทำงานของพวกเขาซึ่งตีพิมพ์ใน Laser & Photonics Reviews ในชื่อ "A General Framework for Knowledge Integration in Machine Learning for Electromagnetic Scattering Using Quasinormal Modes" วางแนวคิดนี้ให้เป็นรูปธรรมโดยใช้แนวคิดทางกายภาพเฉพาะ: 'โหมดกึ่งปกติ' (Quasinormal modes หรือ QNMs) โครงสร้างที่มีการสั่นพ้องทางแสงทุกชนิดจะมีเซ็ตของโหมดเหล่านี้ แต่ละโหมดมีลักษณะเฉพาะด้วยความถี่เชิงซ้อนที่อธิบายทั้งการสั่นและการสลายตัวของมัน สเปกตรัมการกระเจิงของโครงสร้าง ซึ่งเป็นสิ่งที่วิศวกรต้องการควบคุม สามารถแสดงได้ในรูปของผลรวมของส่วนประกอบจากโหมดกึ่งปกติเหล่านี้ ด้วยการจัดโครงสร้างของโครงข่ายประสาทเทียมให้เรียนรู้ในแง่ของส่วนประกอบการสั่นพ้องเหล่านี้โดยธรรมชาติ และเคารพรูปแบบทางคณิตศาสตร์ของการกระเจิงคลื่นแม่เหล็กไฟฟ้าที่ทราบอยู่แล้ว ทีมงานจึงจำกัดกระบวนการเรียนรู้ของแบบจำลองให้สร้างผลลัพธ์ที่สอดคล้องกับสมการของแมกซ์เวลล์เท่านั้น
“เมื่อเราป้อนข้อมูลเกี่ยวกับกฎของฟิสิกส์ให้กับซูเปอร์สมองกล มันก็ฉลาดขึ้นทันที” Tassin อธิบาย “การคำนวณของเราตอนนี้ใช้เวลาเพียงหนึ่งในสิบของที่เคยต้องใช้”
เดิมที การสร้างจุดข้อมูลฝึกสอน 1 จุดด้วยวิธีดั้งเดิมต้องใช้เวลาจำลอง 10–60 นาที การฝึกสอนทั้งชุดอาจต้องใช้จุดข้อมูลมากถึง 40,000 จุด รวมแล้วประมาณหนึ่งเดือน แต่เมื่อมีฟิสิกส์นำทาง เครือข่ายจะเรียนรู้ฟิสิกส์พื้นฐานเดียวกันนั้นด้วยจำนวนตัวอย่างที่น้อยกว่ามาก การสร้างข้อมูลฝึกสอนที่เพียงพอตอนนี้ใช้เวลาประมาณ 3 วัน และเครือข่ายที่ฝึกสอนแล้วสามารถทำนายได้ในหน่วยมิลลิวินาที พร้อมทั้งผลิตค่าประมาณที่น่าเชื่อถือทางกายภาพและปราศจากข้อผิดพลาดร้ายแรง
แนวทางนี้ยังสอดคล้องกับเทรนด์ที่กว้างขึ้นในด้าน machine learning ที่นำโดยฟิสิกส์ งานวิจัยอื่นๆ เมื่อไม่นานมานี้แสดงให้เห็นว่าการฝังสมการของแมกซ์เวลล์เข้าไปในกระบวนการฝึกสอน สามารถปรับปรุงความสอดคล้องทางฟิสิกส์และความสามารถในการสรุปทั่วไป (generalizability) ได้ ในขณะที่ลดความต้องการข้อมูลลงครึ่งหนึ่งหรือมากกว่า โครงข่ายประสาทเทียมที่เข้าใจฟิสิกส์เหล่านี้แสดงถึงการเปลี่ยนผ่านจากการฟิตติ้งข้อมูลแบบมืดบอด ไปสู่แบบจำลองที่เคารพกฎพื้นฐานตั้งแต่ต้น
กลไกหลักคือการกระจายโหมดกึ่งปกติของเมทริกซ์การกระเจิง (scattering matrix) ในโครงสร้างนาโนโฟโตนิกใดๆ แสงจะกระเจิงเมื่อมีปฏิสัมพันธ์กับคุณสมบัติของวัสดุ การกระเจิงนั้นสามารถอธิบายทางคณิตศาสตร์ได้ว่าเป็นการซ้อนทับของโหมดการสั่นพ้อง การสร้างเครือข่ายที่ทำงานในการแสดงแทนเชิงโหมดนี้โดยเนื้อแท้ ช่วยให้นักวิจัยมั่นใจได้ว่าคุณสมบัติทางคณิตศาสตร์บางอย่างของการกระเจิงคลื่นแม่เหล็กไฟฟ้า เช่น ความเป็นเหตุเป็นผล (causality) และโครงสร้างเชิงวิเคราะห์ของสัมประสิทธิ์การกระเจิง จะได้รับการตอบสนองโดยอัตโนมัติ
ผลลัพธ์ในทางปฏิบัติมีสามประการ:
การเร่งความเร็วการออกแบบถึงสิบเท่านี้ ไม่ได้เป็นเพียง benchmark ในห้องปฏิบัติการ แต่ปลดล็อกขั้นตอนการทำงานทางวิศวกรรมเชิงปฏิบัติที่ก่อนหน้านี้เป็นไปไม่ได้
วัสดุเชิงแสงประดิษฐ์ (metamaterials) สามารถผลิตเลนส์ที่บาง เบา และมีประสิทธิภาพมากกว่าแก้วหรือพลาสติกทั่วไป แต่การออกแบบต้องสำรวจพื้นที่พารามิเตอร์ขนาดมหึมา เครือข่ายที่เข้าใจฟิสิกส์สามารถกวาดผ่านแบบที่คาดหวังได้อย่างรวดเร็ว ซึ่งแต่ก่อนต้องใช้เวลาหลายสัปดาห์กับตัวแก้ปัญหาแบบดั้งเดิม
ทีม Chalmers กำลังร่วมมือกับโครงการคอมพิวเตอร์ควอนตัมของมหาวิทยาลัยอย่างแข็งขัน เป้าหมายคือการออกแบบวัสดุโครงสร้างนาโนที่ควบคุมการเดินทางของแสงได้อย่างแม่นยำ เพื่อสร้างช่องทางการสื่อสารที่ความถี่แสงระหว่างหน่วยประมวลผลควอนตัม โดยใช้ photonic crystals ที่ยืดหยุ่นเชิงกล ตัวเชื่อมต่อดังกล่าวเป็นชิ้นส่วนสำคัญในการขยายขนาดคอมพิวเตอร์ควอนตัมให้เกินกว่าไม่กี่คิวบิต
กรอบการทำงานโหมดกึ่งปกติถูกสร้างขึ้นให้เป็นทั่วไปโดยเจตนา มันใช้ได้กับส่วนประกอบเชิงแสงใดๆ ที่อยู่ภายใต้สมการของแมกซ์เวลล์: metasurfaces, metamaterials, waveguides และอื่นๆ งานวิจัยที่เกี่ยวข้องได้แสดงให้เห็นว่าโมเดลที่ฝังฟิสิกส์คล้ายๆ กัน สามารถเพิ่มความเร็วในการหาค่าเหมาะที่สุดได้มากกว่า 80,000 เท่าสำหรับบางงาน ในขณะที่ยังปรับปรุงความแม่นยำในการทำนายอีกด้วย
กลุ่มอื่นๆ ที่ใช้โครงข่ายประสาทเทียมที่เข้าใจฟิสิกส์สำหรับการออกแบบ metasurface ได้แสดงให้เห็นถึงความสามารถในการรักษาประสิทธิภาพเชิงแสงที่สูง ในขณะที่คำนึงถึงความไม่แน่นอนในการผลิต ทำให้การออกแบบเหล่านี้ใช้งานได้จริงมากขึ้นสำหรับการผลิตจริง
ความก้าวหน้าของ Chalmers เน้นย้ำถึงจุดเปลี่ยนที่กว้างขึ้นในนาโนโฟโตนิกส์เชิงคำนวณ วงการนี้ได้นำ machine learning มาใช้อย่างรวดเร็วในช่วงไม่กี่ปีที่ผ่านมา โดยโมเดลต่างๆ ทำความเร็วได้เพิ่มขึ้น 500 เท่า ถึงมากกว่า 10⁶ เท่า เมื่อเทียบกับตัวแก้ปัญหา finite-difference time-domain (FDTD) แบบดั้งเดิม สิ่งที่ทำให้งานของ Chalmers โดดเด่นคือการมุ่งเน้นไปที่การทำให้กระบวนการฝึกสอนนั้นมีประสิทธิภาพมากขึ้นอย่างมาก ผ่านการบูรณาการฟิสิกส์เชิงลึก แทนที่จะเพียงแค่เร่งขั้นตอนการอนุมาน
การฝังสมการของแมกซ์เวลล์ไม่เพียงแต่ใน loss function แต่ในกระดูกสันหลังทางสถาปัตยกรรมของเครือข่าย ทีมงานได้แสดงให้เห็นถึงเส้นทางสู่ตัวแทน machine learning ที่ทั้งรวดเร็วและน่าเชื่อถือ ซึ่งเป็นการผสมผสานที่เคยยากจะบรรลุในการออกแบบแม่เหล็กไฟฟ้า ปัจจุบันทีมอื่นๆ กำลังสำรวจรูปแบบ quantum physics-informed ที่ใช้ประโยชน์จาก parameterized quantum circuits เพื่อแก้สมการของแมกซ์เวลล์ที่ขึ้นกับเวลาได้อย่างมีประสิทธิภาพยิ่งขึ้น
บางทีการรับรองที่บอกอะไรได้มากที่สุดอาจมาจากตัวนักวิจัยเอง Viktor Lilja บรรยายขั้นตอนการทำงานก่อนหน้านี้อย่างตรงไปตรงมาว่า: "คุณเริ่มต้นด้วยกระบวนการออกแบบ และหลังจาก 30 วันคุณถึงจะได้ผลลัพธ์ จากนั้นถ้าคุณรู้ตัวว่าต้องการเพิ่มเติมสิ่งต่างๆ เข้าไปอีก มันอาจใช้เวลาอีกหนึ่งเดือน" แนวทางใหม่นี้บีบอัดไทม์ไลน์นั้นเหลือสามวัน และให้คำตอบในหน่วยมิลลิวินาที ในวงการที่ความเร็วในการวนซ้ำการออกแบบกำหนดจังหวะของนวัตกรรมโดยตรง ความแตกต่างนั้นคือทุกสิ่ง
Comments
0 comments