物理學系教授 Philippe Tassin 同博士生 Viktor Lilja 揀咗一條完全唔同嘅路。佢哋唔係叫一個好似白紙咁嘅神經網絡單憑例子去推理物理,而係俾咗個網絡一個「物理基礎教育」——直接將由麥克斯韋方程組衍生出嚟嘅約束條件,用 hard-code 嘅方式寫入去網絡嘅結構入面 。
佢哋個框架發表喺《Laser & Photonics Reviews》期刊,篇文叫 "A General Framework for Knowledge Integration in Machine Learning for Electromagnetic Scattering Using Quasinormal Modes"(一個利用準正則模態將知識整合到電磁散射機器學習嘅通用框架),將呢個概念圍繞住一個特定物理概念去形式化:準正則模態(QNMs) 。
每一個會共振嘅光學結構都有一組呢啲模態,每個模態都有一個複數頻率去描述佢嘅振盪同衰減。一個結構嘅散射光譜——正正係工程師想控制嘅嘢——可以用呢啲準正則模態嘅貢獻加總嚟表達。
以前,儲一個傳統訓練數據點就要跑一次 10 到 60 分鐘嘅模擬。成個訓練週期可能要 40,000 個呢啲數據點,加加埋埋大約成個月。有咗物理引導,個網絡用少好多例子就已經學得識同樣嘅基礎物理。而家,產生足夠嘅訓練數據大約只需要 3 日,而且訓練好咗嘅網絡可以喺幾毫秒內俾出預測,同時產生嗰啲物理上可靠、冇明顯錯誤嘅估算 。
呢個取態亦都同物理引導機器學習嘅大趨勢不謀而合。近期其他研究都顯示,將麥克斯韋方程組嵌入訓練過程,可以改善物理一致性同泛化能力,同時將數據需求減少一半甚至更多 。呢啲物理知情神經網絡(physics-informed neural networks)代表住一個範式轉移,由盲目嘅數據擬合轉向由頭到尾都尊重基本定律嘅模型。
核心機制係散射矩陣嘅準正則模態展開。喺任何納米光子結構入面,光同材料特性互動嗰陣會散射。嗰種散射喺數學上可以描述為共振模態嘅疊加。
實際嘅好處有三個:
呢個十倍嘅設計加速唔單止係實驗室入面嘅一個基準測試——佢仲開通咗一啲以前做唔到嘅實際工程工作流程。
查爾姆斯團隊正喺度同大學嘅量子電腦項目積極合作。目標係設計納米結構材料,精確控制光點樣行,有可能利用機械順應性光子晶體,喺量子處理器之間建立光頻通訊通道。呢種互連對於將量子電腦由幾個量子位元擴展到更大規模,係好關鍵嘅一環 。
呢個以準正則模態為基礎嘅框架係刻意做得咁通用嘅。佢適用於任何受麥克斯韋方程組支配嘅光學元件:超表面、超材料、波導等等 。相關研究已經展示咗,類似嘅物理嵌入模型喺某啲任務可以實現超過 80,000 倍嘅優化加速,同時仲改善埋預測準確度
。其他團隊用物理知情神經網絡去做超表面設計,亦都展示咗喺考慮埋製造誤差嘅情況下,仍然可以保持高光學性能,令呢啲設計對於真實生產嚟講更加實用
。
查爾姆斯呢個工作嘅與別不同之處,在於佢嘅重點係透過深度物理整合,令個訓練過程本身嘅效率得到戲劇性嘅提升,而唔單止係加快推理嗰一步。
透過將麥克斯韋方程組唔單止嵌入損失函數,而係嵌入到網絡嘅架構骨架入面,呢個團隊展示咗一條邁向既快速又可信嘅機器學習替代模型嘅路徑——喺電磁設計入面,呢個組合歷史上一直都好難實現。其他團隊而家亦都喺度探索量子物理知情變體,利用參數化量子電路去解時變麥克斯韋方程組,效率仲要高啲添 。
新嘅方法將呢個時間線壓縮到三日——仲要喺幾毫秒之內就俾到答案你。喺一個設計迭代速度直接決定創新步伐嘅領域,呢個差別就係一切。
Comments
0 comments