นักวิจัย AI ทั้งในอุตสาหกรรมและสถาบันการศึกษาต่างเห็นพ้องกันอย่างกว้างขวางว่า ข้อกำหนด 'zero-jailbreak' นั้นไม่สามารถบรรลุได้ด้วยวิธีการในปัจจุบัน เหตุผลนั้นลึกซึ้งถึงรากฐานทางคณิตศาสตร์ของการทำงานของ Large Language Model (LLM)
ความขัดแย้งของการเจลเบรก (The Jailbreak Paradox) งานวิจัย arXiv ปี 2024 (อัปเดตล่าสุด พฤษภาคม 2026) ได้พิสูจน์ให้เห็นถึงความขัดแย้งสองประการอย่างเป็นทางการ: ประการแรก เป็นไปไม่ได้ที่จะสร้างตัวแยกประเภทการเจลเบรกที่สมบูรณ์แบบ และประการที่สอง โมเดลที่อ่อนแอกว่าไม่สามารถตรวจจับได้อย่างสม่ำเสมอว่าโมเดลที่แข็งแกร่งกว่าถูกเจลเบรกหรือไม่ นี่ไม่ใช่บั๊กที่สามารถแก้ไขได้ แต่มันคือข้อจำกัดทางคณิตศาสตร์ที่อยู่ในธรรมชาติของวิธีการกำหนด 'การจัดแนว (alignment)'
การแข่งขันทางอาวุธเชิงปรปักษ์ (adversarial arms race) ไม่ใช่ปัญหาที่แก้ได้ การเจลเบรกเป็นปัญหาที่มีลักษณะเป็นปฏิปักษ์โดยพื้นฐาน ผู้โจมตีจะค้นพบรูปแบบพรอมต์ (prompt) ใหม่ๆ เทคนิคการเข้ารหัส และกลยุทธ์แบบหลายรอบที่เลี่ยงตัวกรองที่มีอยู่ได้อย่างต่อเนื่อง ทันทีที่เจลเบรกประเภทหนึ่งถูกปิด ตัวแปรใหม่ๆ ก็จะเกิดขึ้น
การเจลเบรกแบบอัตโนมัติในวงกว้าง งานวิจัยเดือนมีนาคม 2026 ที่ตีพิมพ์ใน Nature Communications พบว่า Large reasoning models (LRMs) สามารถทำหน้าที่เป็นตัวแทนเจลเบรกอัตโนมัติได้ โดยมีอัตราความสำเร็จโดยรวมสูงถึง 97.14% ทุกคู่โมเดลที่ทำการทดสอบ พื้นที่การโจมตีไม่ได้ลดลง แต่กลับขยายตัวมากขึ้นเรื่อยๆ
ฉันทามติของผู้เชี่ยวชาญ ผู้เชี่ยวชาญด้านความปลอดภัยกล่าวว่า การปิดกั้นการเจลเบรกทั้งหมด 'จะหยุดการใช้งาน AI ระดับแนวหน้าทั้งหมด' — มาตรฐานนี้ไม่ใช่เป้าหมายที่แก้บั๊กได้ แต่เป็นข้อพิสูจน์ถึงความเป็นไปไม่ได้ที่มีอยู่จริง
ข้อเรียกร้องนี้ไม่ได้เกิดขึ้นอย่างโดดเดี่ยว แต่เป็นผลจากแรงกดดันจากรัฐบาลที่มีต่อ Anthropic ที่เพิ่มมากขึ้น:
ความขัดแย้งกับเพนตากอนก่อนหน้านี้ Anthropic มีข้อพิพาทกับรัฐบาลสหรัฐฯ เกี่ยวกับปฏิสัมพันธ์กับเพนตากอนอยู่แล้ว ซึ่งได้กำหนดให้บริษัทเป็น 'ความเสี่ยงต่อห่วงโซ่อุปทาน' โดยสั่งให้หน่วยงานรัฐบาลกลางจำกัดหรือหยุดใช้ผลิตภัณฑ์ของบริษัท
ชนวนจาก Amazon แอนดี้ แจสซี (Andy Jassy) ซีอีโอของ Amazon รายงานต่อทำเนียบขาวเกี่ยวกับข้อกังวลด้านความปลอดภัยเฉพาะของ Fable 5 ซึ่งเป็นการเร่งให้รัฐบาลเข้ามาแทรกแซง อย่างน้อยอีกห้าบริษัทก็ได้แจ้งเตือนถึงความกังวลเช่นกัน
การปิดระบบอย่างกะทันหัน เมื่อเวลา 17:21 น. ET ของวันที่ 12 มิถุนายน Anthropic ได้รับจดหมายจากกระทรวงพาณิชย์ ภายในเวลาประมาณ 22:00 น. โมเดลทั้งสองถูกปิดการใช้งานสำหรับลูกค้าทั่วโลก — นับเป็นครั้งแรกที่สหรัฐฯ บังคับใช้มาตรการควบคุมการส่งออกกับโมเดล AI เชิงพาณิชย์ที่เปิดให้สาธารณชนใช้งานอยู่แล้ว
คำขาดการเจลเบรกเป็นศูนย์ หลังจากการปิดระบบ ทำเนียบขาวได้ยกระดับจากข้อจำกัดการส่งออก ไปสู่การกำหนดมาตรฐานความปลอดภัยที่เป็นไปไม่ได้ในทางเทคนิค ซึ่งเป็นเงื่อนไขเบื้องต้นสำหรับการปล่อยโมเดลในอนาคต
TechCrunch มองว่าเหตุการณ์ทั้งหมดนี้เป็น 'การเคลื่อนไหวทางการเมืองที่ไม่เคยเกี่ยวกับการเจลเบรก AI' — เป็นสัญญาณว่ารัฐบาลพร้อมที่จะตัดสินใจเพียงฝ่ายเดียวว่า AI โมเดลใดอันตรายเกินกว่าจะเปิดใช้งาน
ตำแหน่งของทำเนียบขาวตามรายงานจากหลายสำนัก คือ โมเดล Fable 5 ของ Anthropic จะกลับมาใช้งานได้ก็ต่อเมื่อบริษัททำให้การเจลเบรกเป็นไปไม่ได้เท่านั้น นี่ไม่ใช่คำขอให้ปรับปรุงแบบค่อยเป็นค่อยไป หรือกระบวนการบริหารจัดการช่องโหว่แบบเป็นลำดับขั้น แต่เป็นเงื่อนไขแบบขาว-ดำ: ต้องไม่มีการเจลเบรกเกิดขึ้นที่ไหนเลย ไม่เช่นนั้นโมเดลจะไม่ถูกปล่อยออกมา
Anthropic ได้โต้กลับ โดยระบุว่า 'ไม่มีผู้ทดสอบรายใดที่สามารถหาเจลเบรกแบบสากล (universal jailbreak) ได้' และการหลีกเลี่ยงการเจลเบรกโดยสิ้นเชิงนั้น 'เป็นไปไม่ได้สำหรับพวกเขา หรือบริษัทอื่นใด' บริษัทยังระบุอีกว่า 'ไม่ได้รับการเปิดเผยถึงการเจลเบรกแบบไม่สากลที่น่ากังวล ซึ่งนำไปสู่ผลลัพธ์ที่เป็นอันตราย'
จากรายงานของหลายสำนักข่าว Anthropic เผชิญกับสามเส้นทางกลยุทธ์หลัก:
1. การปฏิบัติตามและการเจรจา ดีเอริโอ อาโมเด (Dario Amodei) ซีอีโอได้พบกับเจ้าหน้าที่ทำเนียบขาวเมื่อวันที่ 15 มิถุนายน เพื่อเจรจากรอบการประเมินช่องโหว่ที่ทั้งสองฝ่ายยอมรับได้ — ซึ่งจะมาแทนที่มาตรฐานเด็ดขาดแบบ zero-jailbreak ด้วยมาตรฐานความรุนแรงแบบเป็นลำดับชั้น มีรายงานว่าทำเนียบขาวและ Anthropic กำลังร่วมมือกันพัฒนากรอบการทำงานเพื่อประเมินความรุนแรงของช่องโหว่ด้านความปลอดภัย
นี่คือเส้นทางที่ Anthropic ดูเหมือนจะดำเนินการอยู่ในขณะนี้
2. การท้าทายทางตุลาการหรือการเมือง Anthropic อาจฟ้องร้องคำสั่งควบคุมการส่งออกในศาล โดยโต้แย้งว่ารัฐบาลใช้อำนาจเกินขอบเขตตามกฎหมาย หรือละเมิดกระบวนการทางกฎหมายโดยการใช้มาตรการควบคุมการส่งออกย้อนหลังกับผลิตภัณฑ์เชิงพาณิชย์ที่เปิดเผยต่อสาธารณะ นี่จะเป็นขั้นตอนที่มีความเสี่ยงสูงและเดิมพันสูง ซึ่งอาจสร้างแบบอย่างที่สำคัญ
3. การปรับโครงสร้างหรือย้ายฐานการดำเนินงาน Anthropic อาจจำกัดการปล่อยโมเดลไว้เฉพาะในเขตอำนาจศาลที่มีสภาพแวดล้อมด้านกฎระเบียบที่คาดเดาได้มากกว่า หรือปรับโครงสร้างองค์กรเพื่อแยกผลิตภัณฑ์ที่ให้บริการในสหรัฐฯ ออกจากผลิตภัณฑ์ที่ให้บริการทั่วโลก นักวิเคราะห์บางคนมองว่านี่คือ 'ทางเลือกนิวเคลียร์' ที่จะเปลี่ยนแปลงรูปแบบธุรกิจของ Anthropic อย่างสิ้นเชิง
ข้อพิพาทนี้ทำให้เห็นถึงความตึงเครียดพื้นฐานสามประการที่จะกำหนดอนาคตของ AI ระดับแนวหน้า:
ความเป็นจริงทางเทคนิค กับ กฎระเบียบที่ไร้ขีดจำกัด รัฐบาลกำลังเรียกร้องการรับประกัน — การเจลเบรกเป็นศูนย์ — ที่วิทยาการคอมพิวเตอร์ระบุว่าเป็นไปไม่ได้ หากฝ่ายบริหารยืนกรานในมาตรฐานนี้ ก็เท่ากับว่ามีอำนาจยับยั้งการปล่อยโมเดล AI ระดับแนวหน้าใดๆ ก็ได้ เพราะไม่มีห้องปฏิบัติการใดสามารถผ่านเกณฑ์นี้ได้
การควบคุมการส่งออกซอฟต์แวร์สาธารณะ เป็นครั้งแรกที่สหรัฐฯ ใช้มาตรการควบคุมการส่งออกกับโมเดล AI เชิงพาณิชย์ที่สาธารณชนเข้าถึงได้อยู่แล้ว การกระทำนี้สร้างแบบอย่างว่าห้องปฏิบัติการ AI ใดๆ ก็สามารถถูกสั่งปิดผลิตภัณฑ์ได้ภายในชั่วข้ามคืน โดยอาศัยการกำหนดความมั่นคงแห่งชาติเพียงฝ่ายเดียว
ความเป็นอิสระ กับ การกำกับดูแลโดยพฤตินัย Anthropic ก่อตั้งขึ้นโดยเน้นพันธกิจด้านความปลอดภัยและความเป็นอิสระ การกระทำของทำเนียบขาวแสดงให้เห็นว่าแม้แต่ห้องปฏิบัติการที่ 'มีความรับผิดชอบ' ที่สุดก็อาจถูกบังคับให้ปฏิบัติตามมาตรฐานของรัฐบาลที่เป็นไปไม่ได้ในทางเทคนิค — หรือไม่ก็ถูกปิดผลิตภัณฑ์ ดังที่ Bloomberg กล่าวไว้ การบล็อกครั้งนี้ถือเป็น 'การกลับทิศของสหรัฐฯ' และเป็น 'คำเตือนถึงซิลิคอนแวลลีย์' ว่ายุคของการปล่อย AI ระดับแนวหน้าด้วยการกำกับดูแลตนเองอาจจะสิ้นสุดลงแล้ว
Comments
0 comments