อีกหนึ่งความสามารถสำคัญคือการ สร้าง proof‑of‑concept (PoC) exploit แบบอัตโนมัติ
จากการทดลองของ Cloudflare โมเดลสามารถทำกระบวนการต่อไปนี้ได้เอง:
กระบวนการแบบวนลูปนี้ทำให้โมเดลสามารถเปลี่ยนจากการ “พบช่องโหว่” ไปสู่การ พิสูจน์ว่าช่องโหว่นั้นใช้โจมตีได้จริง โดยแทบไม่ต้องมีมนุษย์ช่วย
สำหรับทีมความปลอดภัย ขั้นตอนสร้าง PoC มักเป็นงานที่ใช้เวลามาก เพราะต้องพิสูจน์ว่าบั๊กนั้น exploitable จริง การทำขั้นตอนนี้แบบอัตโนมัติช่วยให้จัดลำดับความสำคัญของการแก้ไขช่องโหว่ได้เร็วขึ้น
เอกสารของ Anthropic เกี่ยวกับ Mythos Preview ยังกล่าวถึงความสามารถที่ทดสอบภายใน เช่น
สิ่งเหล่านี้ชี้ว่าโมเดลถูกออกแบบมาเพื่อการวิเคราะห์ช่องโหว่และการสร้าง exploit โดยเฉพาะ ไม่ใช่แค่ช่วยเขียนโค้ดทั่วไป
แม้ Mythos จะมีความสามารถสูง แต่การทดสอบก็พบจุดอ่อนสำคัญหลายอย่าง
โมเดลบางครั้งรายงานช่องโหว่ที่ ไม่สามารถโจมตีได้จริง หรือจัดประเภทผิด โดยเฉพาะในโครงการที่เขียนด้วยภาษาอย่าง C หรือ C++ ซึ่งมีความเสี่ยงด้านหน่วยความจำสูง ทำให้ยังต้องมีการตรวจสอบโดยมนุษย์
Cloudflare ยังพบพฤติกรรมด้านความปลอดภัยที่ ไม่คงที่ บางครั้งโมเดลจะระบุเส้นทางโจมตีได้ แต่ปฏิเสธที่จะสาธิตหรือสร้าง exploit ต่อเพราะระบบป้องกันภายใน ขณะที่บางกรณีกลับดำเนินการต่อไปได้ไกลกว่านั้นก่อนหยุด
สิ่งนี้สะท้อนความท้าทายของการออกแบบ AI ที่ต้อง มีความสามารถด้านการวิจัยความปลอดภัย แต่ก็ต้องป้องกันการนำไปใช้โจมตี
การทดลองของ Cloudflare ชี้ให้เห็นการเปลี่ยนแปลงสำคัญของงานวิจัยด้านช่องโหว่ซอฟต์แวร์
สำหรับฝ่ายป้องกัน ระบบแบบ Mythos อาจช่วย:
แต่ในอีกด้านหนึ่ง ความสามารถเดียวกันนี้ก็สร้างความกังวล หากโมเดลลักษณะนี้ตกไปอยู่ในมือผู้โจมตี เพราะมันสามารถลดทั้ง ทักษะและเวลาที่ต้องใช้ในการสร้าง exploit จริง
Cloudflare จึงชี้ว่าการ “แพตช์ให้เร็วขึ้น” เพียงอย่างเดียวอาจไม่พออีกต่อไป เมื่อ AI สามารถค้นหาและเชื่อมช่องโหว่ได้ในระดับอัตโนมัติ องค์กรอาจต้องปรับสถาปัตยกรรมการจัดการช่องโหว่ใหม่ทั้งหมด
Claude Mythos Preview เป็นตัวอย่างชัดของเทคโนโลยีแบบ dual‑use คือสามารถใช้ได้ทั้งเพื่อป้องกันและเพื่อโจมตี
ด้วยเหตุนี้ โมเดลจึงยัง ไม่ได้เปิดให้ใช้งานสาธารณะ และถูกจำกัดให้เฉพาะองค์กรที่เข้าร่วม Project Glasswing เพื่อการทดสอบด้านความปลอดภัยเท่านั้น
ผลการทดลองของ Cloudflare จึงเป็นสัญญาณว่า AI กำลังขยับจากการช่วยเขียนโค้ด ไปสู่การ วิเคราะห์ช่องโหว่และสร้างการโจมตีแบบครบกระบวนการ ซึ่งอาจเปลี่ยนทั้งวิธีป้องกันและวิธีโจมตีในโลกไซเบอร์ในอนาคตอันใกล้
Comments
0 comments