Các kỹ sư đã tìm đến mạng nơ-ron sâu như những công cụ thay thế nhanh cho các bộ giải điện từ cổ điển. Ý tưởng rất đơn giản: huấn luyện một mạng trên hàng nghìn cặp dữ liệu (hình học, phản hồi quang học), sau đó sử dụng nó để dự đoán các thuộc tính của thiết kế mới chỉ trong một phần nghìn giây thay vì hàng phút hoặc hàng giờ. Tuy nhiên, vấn đề là các mạng nơ-ron tiêu chuẩn tiếp cận việc này như một bài tập nhận diện mẫu thuần túy. Chúng vốn không hề có kiến thức gì về vật lý, vì vậy cần một lượng dữ liệu khổng lồ chỉ để học được các hành vi điện từ cơ bản – 40.000 mô phỏng tiêu tốn 30 ngày thường chỉ là mức tối thiểu, và thậm chí sau đó, các mô hình vẫn có thể tạo ra những kết quả bất khả thi về mặt vật lý .
Philippe Tassin, giáo sư tại Khoa Vật lý của Chalmers, và nghiên cứu sinh Viktor Lilja đã thực hiện một cách tiếp cận khác biệt về cơ bản. Thay vì yêu cầu một mạng nơ-ron "tờ giấy trắng" tự suy luận ra vật lý từ các ví dụ, họ đã cho nó một "nền tảng giáo dục vật lý cơ bản" bằng cách mã hóa cứng các ràng buộc rút ra từ phương trình Maxwell trực tiếp vào cấu trúc của mạng .
Khuôn khổ của họ, được công bố trên tạp chí Laser & Photonics Reviews với tiêu đề "A General Framework for Knowledge Integration in Machine Learning for Electromagnetic Scattering Using Quasinormal Modes", chính thức hóa ý tưởng này xoay quanh một khái niệm vật lý cụ thể: các chế độ tựa chuẩn (quasinormal modes - QNMs) . Mọi cấu trúc quang học cộng hưởng đều có một tập hợp các chế độ này, mỗi chế độ được đặc trưng bởi một tần số phức mô tả cả sự dao động lẫn sự suy giảm của nó. Phổ tán xạ của một cấu trúc – chính là thứ mà các kỹ sư muốn kiểm soát – có thể được biểu diễn dưới dạng tổng của các đóng góp từ những chế độ tựa chuẩn này. Bằng cách cấu trúc mạng nơ-ron để nó tự nhiên học hỏi dựa trên các đóng góp cộng hưởng này và tôn trọng dạng toán học đã biết của tán xạ điện từ, nhóm nghiên cứu đã giới hạn quá trình học của mô hình để chỉ tạo ra những kết quả nhất quán với các phương trình Maxwell
.
"Khi chúng tôi cung cấp cho siêu não bộ thông tin về các định luật vật lý, nó ngay lập tức trở nên thông minh hơn hẳn," Tassin giải thích. "Các phép tính của chúng tôi giờ đây chỉ mất một phần mười thời gian so với trước kia" .
Trước đây, một điểm dữ liệu huấn luyện truyền thống cần mô phỏng mất 10–60 phút. Toàn bộ một chiến dịch huấn luyện có thể cần tới 40.000 điểm dữ liệu như vậy, tổng cộng khoảng một tháng. Với sự dẫn đường của vật lý, mạng học được cùng một nền tảng vật lý đó chỉ với ít ví dụ hơn rất nhiều. Việc tạo đủ dữ liệu huấn luyện giờ chỉ mất khoảng 3 ngày, và mạng đã được huấn luyện đưa ra dự đoán trong một phần nghìn giây đồng thời tạo ra các ước tính đáng tin cậy về mặt vật lý và không mắc các lỗi rõ ràng .
Cách tiếp cận này cũng phù hợp với các xu hướng rộng lớn hơn trong lĩnh vực máy học được hướng dẫn bởi vật lý. Nhiều công trình gần đây khác đã cho thấy việc nhúng các phương trình Maxwell vào quá trình huấn luyện có thể cải thiện tính nhất quán vật lý và khả năng tổng quát hóa, đồng thời giảm một nửa hoặc hơn nhu cầu về dữ liệu . Những mạng nơ-ron am hiểu vật lý này thể hiện một sự chuyển dịch từ việc khớp dữ liệu một cách mù quáng sang các mô hình tôn trọng các định luật cơ bản ngay từ đầu.
Cơ chế cốt lõi là sự khai triển chế độ tựa chuẩn của ma trận tán xạ. Trong bất kỳ cấu trúc quang tử nano nào, ánh sáng tán xạ khi tương tác với các đặc trưng vật liệu. Sự tán xạ đó có thể được mô tả toán học như một sự chồng chập của các chế độ cộng hưởng. Bằng cách xây dựng một mạng hoạt động một cách tự nhiên trong biểu diễn modal này, các nhà nghiên cứu đã đảm bảo rằng các thuộc tính toán học nhất định của tán xạ điện từ – như tính nhân quả và cấu trúc giải tích của các hệ số tán xạ – được tự động thỏa mãn .
Những lợi ích thực tế gồm ba điểm chính:
Tốc độ thiết kế tăng gấp mười lần không chỉ là một điểm chuẩn trong phòng thí nghiệm – nó mở khóa các quy trình làm việc kỹ thuật thực tiễn mà trước đây là không khả thi.
Vật liệu quang học nhân tạo (siêu vật liệu) có thể tạo ra các thấu kính mỏng hơn, nhẹ hơn và hiệu quả hơn so với thủy tinh hoặc nhựa thông thường, nhưng việc thiết kế chúng đòi hỏi phải khám phá những không gian tham số khổng lồ. Mạng am hiểu vật lý có thể nhanh chóng quét qua các thiết kế ứng viên mà trước đây phải mất hàng tuần với các bộ giải truyền thống .
Nhóm nghiên cứu tại Chalmers đang tích cực hợp tác với dự án máy tính lượng tử của trường. Mục tiêu là thiết kế các vật liệu cấu trúc nano có thể kiểm soát chính xác cách ánh sáng truyền đi, có khả năng tạo ra các kênh giao tiếp tần số quang học giữa các bộ xử lý lượng tử bằng cách sử dụng các tinh thể quang tử tuân thủ cơ học. Những kết nối như vậy là một mảnh ghép quan trọng để mở rộng quy mô máy tính lượng tử vượt ra ngoài một vài qubit .
Khuôn khổ chế độ tựa chuẩn được cố ý thiết kế để mang tính tổng quát. Nó áp dụng cho bất kỳ thành phần quang học nào được điều chỉnh bởi các phương trình Maxwell: siêu bề mặt, siêu vật liệu, ống dẫn sóng, v.v. . Các nghiên cứu liên quan đã chứng minh rằng các mô hình nhúng vật lý tương tự có thể đạt được tốc độ tối ưu hóa nhanh hơn tới 80.000 lần cho một số tác vụ nhất định, đồng thời cải thiện độ chính xác của dự đoán
. Các nhóm khác sử dụng mạng nơ-ron am hiểu vật lý cho thiết kế siêu bề mặt đã cho thấy khả năng duy trì hiệu suất quang học cao trong khi tính đến các bất định trong chế tạo, khiến những thiết kế này trở nên thực tế hơn nhiều cho sản xuất thực sự
.
Bước đột phá của Chalmers làm nổi bật một điểm uốn lớn hơn trong lĩnh vực quang tử nano tính toán. Lĩnh vực này đã nhanh chóng ứng dụng máy học trong vài năm qua, với các mô hình đạt được tốc độ tăng từ 500 lần đến hơn 10⁶ lần so với các bộ giải miền thời gian sai phân hữu hạn (FDTD) truyền thống . Điều làm nên sự khác biệt trong công trình của Chalmers là sự tập trung vào việc làm cho chính quá trình huấn luyện trở nên hiệu quả hơn một cách đáng kể thông qua tích hợp vật lý sâu, thay vì chỉ tăng tốc bước suy luận.
Bằng cách nhúng các phương trình Maxwell không chỉ đơn thuần trong một hàm mất mát mà trong chính cấu trúc nền tảng của mạng, nhóm nghiên cứu đã chứng minh một con đường hướng tới các giải pháp thay thế máy học vừa nhanh vừa đáng tin cậy – một sự kết hợp vốn khó đạt được trong lịch sử thiết kế điện từ. Các nhóm khác hiện đang khám phá các biến thể am hiểu vật lý lượng tử, tận dụng các mạch lượng tử được tham số hóa để giải các phương trình Maxwell phụ thuộc thời gian với hiệu quả thậm chí còn lớn hơn .
Có lẽ sự xác nhận thuyết phục nhất đến từ chính các nhà nghiên cứu. Viktor Lilja đã mô tả quy trình làm việc trước đây một cách thẳng thắn: "Bạn bắt đầu một quá trình thiết kế và sau 30 ngày bạn nhận được kết quả. Sau đó, nếu bạn nhận ra mình cần thêm vào nhiều thứ nữa, có thể mất thêm một tháng nữa" . Cách tiếp cận mới thu gọn dòng thời gian đó xuống còn ba ngày – và đưa ra câu trả lời trong một phần nghìn giây. Trong một lĩnh vực mà tốc độ lặp lại thiết kế quyết định trực tiếp nhịp độ đổi mới, sự khác biệt đó là tất cả.
Comments
0 comments