מהנדסים פנו לרשתות נוירונים עמוקות כתחליפים מהירים לסולברים (פותרים) אלקטרומגנטיים קלאסיים. הרעיון פשוט: לאמן רשת על אלפי זוגות של (גאומטריה, תגובה אופטית), ואז להשתמש בה כדי לחזות את התכונות של עיצובים חדשים באלפיות שנייה במקום דקות או שעות. הקאץ' הוא שרשתות נוירונים סטנדרטיות ניגשות לזה כאל תרגיל טהור של זיהוי תבניות. אין להן שום ידע מובנה בפיזיקה, ולכן הן זקוקות למערכי נתונים עצומים אפילו כדי ללמוד התנהגות אלקטרומגנטית בסיסית – 40,000 סימולציות שגוזלות 30 יום היו לרוב המינימום ההכרחי, וגם אז המודלים עלולים היו לייצר תוצאות בלתי אפשריות פיזיקלית .
פיליפ טאסן, פרופסור במחלקה לפיזיקה בצ'אלמרס, ותלמיד הדוקטורט ויקטור ליליה נקטו בגישה שונה מהיסוד. במקום לבקש מרשת נוירונים שמתחילה מאפס להסיק את חוקי הפיזיקה מדוגמאות בלבד, הם העניקו לה "חינוך בסיסי בפיזיקה" על ידי קידוד אילוצים שנגזרו ממשוואות מקסוול ישירות לתוך מבנה הרשת .
המסגרת התאורטית שלהם, שפורסמה בכתב העת Laser & Photonics Reviews במאמר שכותרתו "A General Framework for Knowledge Integration in Machine Learning for Electromagnetic Scattering Using Quasinormal Modes", ממסדת רעיון זה סביב מושג פיזיקלי ספציפי: מודוסים קוואזי-נורמליים (Quasinormal Modes - QNMs) . לכל מבנה אופטי תהודה יש קבוצה של מודוסים כאלה, שכל אחד מהם מאופיין בתדר מרוכב המתאר הן את התנודה והן את דעיכתו. ספקטרום הפיזור של מבנה – בדיוק הדבר שהמהנדסים רוצים לשלוט בו – יכול להיות מיוצג כסכום של תרומות מהמודוסים הקוואזי-נורמליים הללו. על ידי מבנה רשת הנוירונים כך שהיא לומדת מטבעה במונחים של תרומות תהודתיות אלו ומכבדת את הצורה המתמטית הידועה של פיזור אלקטרומגנטי, הצוות הגביל את תהליך הלמידה של המודל כך שיפיק רק תוצרים העקביים עם משוואות מקסוול
.
"כשהאכלנו את מוח-העל במידע על חוקי הפיזיקה, הוא נעשה הרבה יותר חכם מיד," הסביר טאסן. "החישובים שלנו לוקחים עכשיו עשירית מהזמן שנדרש קודם לכן" .
נקודת נתונים בודדת לאימון מסורתי דרשה בעבר סימולציה של 10–60 דקות. קמפיין אימון שלם יכול היה לדרוש עד 40,000 נקודות כאלה, בסך הכל כחודש. עם הכוונה פיזיקלית, הרשת לומדת את אותה הפיזיקה הבסיסית עם הרבה פחות דוגמאות. יצירת מספיק נתוני אימון לוקחת עכשיו כ-3 ימים, והרשת המאומנת מספקת את התחזיות שלה באלפיות שנייה תוך שהיא מפיקה אומדנים אמינים פיזיקלית ונטולי שגיאות בולטות .
גישה זו גם מתיישרת עם מגמות רחבות יותר בלמידת מכונה מונחית-פיזיקה. עבודות אחרות הראו שהטמעת משוואות מקסוול בתהליך האימון יכולה לשפר את העקביות הפיזיקלית ואת יכולת ההכללה, תוך הפחתת דרישות הנתונים בחצי או יותר . רשתות נוירונים מבוססות-פיזיקה (PINNs) אלה מייצגות מעבר מהתאמת נתונים עיוורת לעבר מודלים שמכבדים חוקים יסודיים מלכתחילה.
מנגנון הליבה הוא פיתוח מטריצת הפיזור לפי מודוסים קוואזי-נורמליים. בכל מבנה ננופוטוני, אור מתפזר בעת אינטראקציה עם מאפייני החומר. פיזור זה יכול להיות מתואר מתמטית כסופרפוזיציה של מודוסי תהודה. על ידי בניית רשת שפועלת מטבעה בייצוג מודאלי זה, החוקרים הבטיחו שתכונות מתמטיות מסוימות של פיזור אלקטרומגנטי – כמו סיבתיות (Causality) והמבנה האנליטי של מקדמי הפיזור – מתקיימות באופן אוטומטי .
התוצאה המעשית היא משולשת:
האצת התכנון פי עשרה היא לא רק הישג מעבדתי – היא פותחת תהליכי עבודה הנדסיים שפשוט לא היו אפשריים קודם.
חומרים אופטיים מלאכותיים (מטא-חומרים) יכולים לייצר עדשות דקות, קלות ויעילות יותר מזכוכית או פלסטיק רגילים, אך תכנונם דורש חקירת מרחבי פרמטרים עצומים. הרשת מבוססת הפיזיקה יכולה לסרוק במהירות מועמדים לעיצוב שהיו גוזלים שבועות עם סולברים מסורתיים .
צוות צ'אלמרס משתף פעולה באופן פעיל עם פרויקט המחשב הקוונטי של האוניברסיטה. המטרה היא לתכנן חומרים ננו-מבניים שישלטו במדויק על איך האור נע, ובכך ליצור ערוצי תקשורת בתדר אופטי בין מעבדים קוונטיים תוך שימוש בגבישים פוטוניים תואמים מכנית (Mechanically Compliant). רכיבי תקשורת כאלה הם רכיב קריטי להגדלת מחשבים קוונטיים מעבר לקיוביטים בודדים .
מסגרת המודוסים הקוואזי-נורמליים היא כללית במתכוון. היא חלה על כל רכיב אופטי הנשלט על ידי משוואות מקסוול: משטחים אופטיים, מטא-חומרים, מובילי גל ועוד . מחקרים קרובים הראו שמודלים דומים עם פיזיקה מוטמעת יכולים להשיג האצות אופטימיזציה של למעלה מפי 80,000 תוך שיפור דיוק התחזיות
. קבוצות אחרות המשתמשות ברשתות מבוססות-פיזיקה לתכנון משטחים אופטיים הראו יכולת לשמור על ביצועים אופטיים גבוהים תוך התחשבות באי-ודאויות ייצור, מה שהופך את התכנונים להרבה יותר פרקטיים לתעשייה
.
פריצת הדרך של צ'אלמרס מדגישה נקודת מפנה רחבה יותר בננופוטוניקה חישובית. התחום מאמץ למידת מכונה בקצב מהיר בשנים האחרונות, עם מודלים שמשיגים האצות של פי 500 ועד למעלה מפי מיליון בהשוואה לסולברים מבוססי FDTD מסורתיים . מה שמייחד את עבודת צ'אלמרס הוא ההתמקדות בהפיכת תהליך האימון עצמו ליעיל הרבה יותר באמצעות אינטגרציה עמוקה של פיזיקה, במקום להאיץ רק את שלב ההסקה.
על ידי הטמעת משוואות מקסוול לא רק בפונקציית ההפסד (Loss Function) אלא בעצמות הארכיטקטוניות של הרשת, הצוות הדגים דרך ליצור תחליפי למידת מכונה שהם גם מהירים וגם אמינים – שילוב שהיה חמקמק מבחינה היסטורית בתכנון אלקטרומגנטי. צוותים אחרים בוחנים כעת וריאנטים המבוססים על פיזיקה קוונטית הממנפים מעגלים קוונטיים פרמטריים לפתרון משוואות מקסוול תלויות-זמן ביעילות רבה אף יותר .
אולי ההמלצה החזקה ביותר מגיעה מהחוקרים עצמם. ויקטור ליליה תיאר את תהליך העבודה הקודם בבוטות: "מתחילים בתהליך עיצוב ואחרי 30 יום מקבלים את התוצאות. ואז, אם מבינים שצריך להוסיף דברים נוספים, זה יכול לקחת עוד חודש" . הגישה החדשה מכווצת את לוח הזמנים לשלושה ימים – ומספקת תשובות באלפיות שנייה. בתחום שבו מהירות מחזור התכנון מכתיבה ישירות את קצב החדשנות, ההבדל הזה הוא הכול.
Comments
0 comments