查爾默斯大學物理系的 Philippe Tassin 教授與博士生 Viktor Lilja 走了一條截然不同的路。他們不要求一張白紙般的神經網路只靠範例來自行歸納物理,而是直接給了它「基礎物理教育」——把從馬克士威方程組推導出的約束條件寫死在網路結構裡 。
他們提出的架構發表於《Laser & Photonics Reviews》,論文題為「A General Framework for Knowledge Integration in Machine Learning for Electromagnetic Scattering Using Quasinormal Modes」,圍繞著一個特定的物理概念來展開:準正則模態(Quasinormal Modes, QNMs)。每個共振型光學結構都有一組準正則模態,每個模態由一個複數頻率描述,同時捕捉了振盪與衰減的行為。一道結構的散射光譜——正是工程師想要控制的東西——可以表示為這些準正則模態貢獻的總和。透過將神經網路結構化,使其本質上以這些共振貢獻來學習,並遵守電磁散射已知的數學形式,團隊將模型的學習過程限制在只能產出與馬克士威方程組一致的結果
。
以往生成一筆傳統訓練資料需要 10 到 60 分鐘的模擬。整個訓練過程可能要求高達 40,000 筆這樣的資料,總計約莫一個月。有了物理引導,神經網路可以用少得多的範例來學會相同的基礎物理。現在,生成充足的訓練資料只要大約 3 天,而且訓練好的網路只需毫秒就能給出預測,產出的結果在物理上可靠,也不會出現那些離譜的錯誤 。
這一套做法也呼應了物理引導式機器學習的廣泛趨勢。其他近期研究顯示,將馬克士威方程組嵌入訓練流程,可以提升模型在物理上的一致性與泛化能力,同時將資料需求砍半甚至更多 。這類物理知情神經網路(Physics-Informed Neural Networks, PINNs)象徵著從盲目擬合數據,轉型為從一開始就尊重基本定律的模型。
核心機制建立在散射矩陣的準正則模態展開上。在任一奈米光子結構中,光與材料特徵互動而產生散射。這種散射在數學上可描述為共振模態的疊加。透過搭建一個本質上就在此模態表徵中運作的神經網路,研究人員確保了電磁散射的某些數學性質——像是因果律與散射係數的解析結構——能被自動滿足 。
實際帶來的好處有三:
這項高達十倍的設計加速不只是實驗室裡的漂亮數據,它開通了過去窒礙難行的工程流程。
查爾默斯團隊正與校內的量子電腦計畫積極合作。目標是設計奈米結構材料來精準控制光的行進,藉由機械相容的光子晶體,在量子處理器之間打造光頻通訊通道。這類互連技術是將量子電腦從少數量子位元擴展出去的關鍵環節 。
這套準正則模態框架刻意保持通用性。它適用於任何受馬克士威方程組支配的光學元件:超穎表面、超穎材料、波導等等 。相關研究也證明,類似的物理嵌入式模型在某些任務中可達成超過 80,000 倍的優化加速,同時提升預測精準度
。其他團隊利用物理知情神經網路來設計超穎表面時,也展現出在考量製造誤差的情況下仍可維持高光學效能,使這些設計更貼近真實量產需求
。
查爾默斯的突破凸顯了計算奈米光子學一個更廣泛的轉折點。這個領域在過去幾年快速導入機器學習,模型與傳統有限差分時域法相比可達成 500 倍到超過 10⁶ 倍的加速 。查爾默斯這項工作的獨特之處,在於把焦點放在透過深度物理整合來讓訓練過程本身大幅更有效率,而不只是加速推論這一步。
透過將馬克士威方程組不僅寫入損失函數,更寫入網路架構的骨幹中,團隊展示了一條通往既快速又值得信賴的機器學習替代模型之路,這種組合在電磁設計領域向來難以實現。其他團隊現在也開始探索量子物理知情變體,運用參數化量子電路來求解時變馬克士威方程組,追求更高效率 。
或許最傳神的背書來自研究人員本身。Viktor Lilja 直白地描述以往的工作流程:「你啟動一個設計流程,經過 30 天後拿到結果。然後當你發現需要加更多東西,可能又要再耗掉一個月。」 新的方法把這段時間線濃縮成三天,而且在毫秒間就能給出答案。在一個設計迭代速度直接左右創新步伐的領域裡,這樣的差異就是一切。
Comments
0 comments