เพื่อให้โครงข่ายมีพื้นที่ว่างพอที่จะซึมซับฟิสิกส์ใหม่ที่แตกต่างไปจากเดิมอย่างสิ้นเชิง ทีมวิจัยได้เสริมแต่งสถาปัตยกรรมด้วยโหนดคอขวดจำลอง (Dummy Bottleneck Nodes) ค่าพารามิเตอร์เพิ่มเติมเหล่านี้ทำหน้าที่เหมือนช่องว่างในระหว่างการฝึกขั้นต้น และจะถูกเติมเต็มด้วยลายเซ็นของฟิสิกส์แปลกใหม่ในระหว่างขั้นตอน Fine-tuning ในภายหลัง
ผลลัพธ์ที่ได้นั้นน่าทึ่ง ในกรณีที่ดีที่สุด วิธีการ Transfer Learning นี้สามารถลดจำนวนซิมูเลชัน ΛCDM ที่มีราคาแพงและจำเป็นต้องใช้ลงได้มากกว่าหนึ่งลำดับขนาด (หรือ 10 เท่า) ในขณะที่ยังคงช่วยให้การอนุมานผลลัพธ์เป็นไปอย่างแม่นยำ เทคนิคนี้เปลี่ยนการลงทุนระดับโลกที่มีอยู่แล้วในเรื่องซิมูเลชันแบบจำลองมาตรฐาน ให้กลายเป็นทรัพยากรที่นำกลับมาใช้ใหม่ได้สำหรับการค้นพบในอนาคต ซึ่งเป็นการข้ามผ่านปัญหาคอขวดสำคัญสำหรับการทดลองอย่าง DESI (Dark Energy Spectroscopic Instrument) ได้อย่างมีประสิทธิภาพ
การค้นพบที่ชวนให้ฉุกคิดมากที่สุดของงานวิจัยนี้คือรูปแบบความล้มเหลวที่แน่ชัดของเทคนิคนี้ เมื่อปรากฏการณ์ของฟิสิกส์ใหม่นั้นดูคล้ายกับสิ่งที่แบบจำลองเรียนรู้มาจาก ΛCDM มากเกินไป ความรู้เดิมของ AI จะกลายเป็นภาระทันที ความล้มเหลวนี้เรียกว่า Negative Transfer กล่าวคือ การ Fine-tuning กลับทำให้ประสิทธิภาพแย่ลงอย่างน่าประหลาด
ต้นตอของปัญหาคือ ความเสื่อมทางกายภาพ (Physical Degeneracy) ยกตัวอย่างเช่น ลายเซ็นทางเอกภพวิทยาที่เกิดจากนิวทริโนที่มีมวล ซึ่งก็คือการยับยั้งการกระจุกตัวของสสารในระดับเล็กนั้น สามารถเลียนแบบลายเซ็นของค่าความผันผวนของสสาร (σ₈) ที่ต่ำลงในเอกภพแบบ ΛCDM มาตรฐานได้อย่างแนบเนียน เมื่อโครงข่ายเจอสัญญาณนิวทริโนนี้ อคติที่ฝังแน่นจากการฝึกด้วย ΛCDM จะทำให้มันตีความผิดว่าเป็นแค่การเปลี่ยนแปลงค่าพารามิเตอร์ธรรมดาในแบบจำลองมาตรฐาน และนำไปสู่การสรุปผลที่ผิดพลาด
ดังที่รายงานฉบับหนึ่งอธิบายไว้ AI จะเข้ารหัสความสัมพันธ์ของพารามิเตอร์ในแบบจำลองมาตรฐาน ว่าเป็นอคติที่ฝังลึกในโครงข่าย และ "อคติเหล่านั้นจะกลายเป็นภาระทันทีที่เป้าหมายของการฝึกคือการตรวจจับสิ่งใหม่ๆ"
ไม่ใช่ว่าเทคนิค Transfer Learning ทั้งหมดจะเปราะบางเท่ากัน งานวิจัยนี้ได้ทดสอบสถาปัตยกรรมที่แตกต่างกันอย่างเป็นระบบ และค้นพบว่าวิธีการ Fine-tuning แบบง่ายๆ โดยไม่มีการออกแบบ 'โครงข่ายจำลอง' พิเศษนั้นมีแนวโน้มที่จะเกิด Negative Transfer ได้ง่ายกว่ามาก โครงสร้างแบบคอขวด (Bottleneck) คือสิ่งจำเป็นเพื่อให้ได้ผลลัพธ์ที่แข็งแกร่งและเชื่อถือได้ มันเป็นจุดกึ่งกลางที่สำคัญ ทำให้โครงข่ายสามารถนำตัวแยกแยะคุณสมบัติอันทรงพลังของ ΛCDM กลับมาใช้ใหม่ได้ ในขณะเดียวกันก็มอบความสามารถใหม่ที่ถูกกำหนดไว้โดยเฉพาะ เพื่อใช้ในการทำแบบจำลองฟิสิกส์ใหม่ที่ไม่คุ้นเคยอย่างแท้จริง
Comments
0 comments