查尔姆斯理工大学物理系的Philippe Tassin教授和他的博士生Viktor Lilja采取了一种截然不同的方法。他们并没有让一张白纸般的神经网络仅从例子中推断物理规律,而是通过将源自麦克斯韦方程组的约束条件直接硬编码进网络结构,给它进行了一次“物理学扫盲”。
他们的框架发表在《激光与光子学评论》上,题为“利用准正则模进行电磁散射机器学习知识集成的通用框架”。该框架围绕一个特定的物理概念展开:准正则模(Quasinormal Modes, QNMs)。每个谐振光学结构都有一组这样的模式,每个模式都由一个复频率来表征,描述其振荡和衰减。一个结构的散射谱——正是工程师想要控制的对象——可以表示为这些准正则模贡献之和。通过构建神经网络,使其本质上按照这些谐振贡献进行学习,并遵循已知的电磁散射数学形式,团队将模型的学习过程约束在了只能产生与麦克斯韦方程组一致的输出范围内
。
一个传统的训练数据点,以前需要10到60分钟的模拟。一次完整的训练活动可能需要多达4万个这样的数据点,总计约一个月。有了物理知识的引导,网络仅需少得多的例子就能学会同样的基础物理。生成足够的训练数据现在大约只需要3天,而训练好的网络在做出预测时只需几毫秒,并且给出的估算值物理上可靠,不会出现明显错误。
这种方法也符合物理引导机器学习的大趋势。近期的其他研究也表明,将麦克斯韦方程组嵌入训练过程可以提升模型的物理一致性和泛化能力,同时将数据需求减半或更多。这些物理知情神经网络代表了一种从盲目数据拟合向从一开始就尊重基本定律的模型的范式转移。
核心机制是散射矩阵的准正则模展开。在任何纳米光子结构中,光在与材料特征相互作用时会发生散射。这种散射可以数学地描述为谐振模式的叠加。通过构建一个本质上在这种模态表示中运行的网络,研究人员确保了电磁散射的某些数学特性——比如因果律和散射系数的解析结构——能自动得到满足。
其实际效果体现在三个方面:
这种十倍的设计加速并不只是实验室里的基准测试——它开启了过去不可行的实际工程流程。
查尔姆斯团队正在与该校的量子计算机项目积极合作。目标是设计出能精确控制光传输的纳米结构材料,利用柔顺的光子晶体,有望在量子处理器之间创建光学频率的通信通道。这种互联对于将量子计算机规模从几个量子比特推向更大规模至关重要。
这套准正则模框架是刻意设计为通用的。它适用于任何受麦克斯韦方程组支配的光学元件:超构表面、超构材料、波导等等。相关研究已经证明,类似的物理嵌入模型在某些任务中可以实现超过8万倍的优化加速,同时还能提升预测精度
。其他利用物理知情神经网络进行超构表面设计的团队也已证明,可以在考虑制造不确定性的情况下保持高光学性能,使这些设计对实际生产来说更为实用
。
查尔姆斯大学的这项突破凸显了计算纳米光子学的一个更广泛的拐点。该领域在过去几年间快速采纳了机器学习,模型相较传统时域有限差分(FDTD)求解器实现了500倍到超过100万倍的加速。查尔姆斯这项工作的与众不同之处在于,它将重点放在通过深度物理集成,让训练过程本身的效率得到巨大提升,而不仅仅是加速推理步骤。
通过将麦克斯韦方程组不仅作为一个损失函数项,而是植入于网络的架构骨架中,该团队展示了一条通往快速且可信的机器学习代理模型的道路——这种组合在电磁设计中历来难以实现。其他团队如今正在探索量子物理知情变体,利用参数化量子电路来更高效地求解含时麦克斯韦方程组。
Comments
0 comments