แนวทางนี้ทำให้องค์กรมีศูนย์ควบคุมเดียวสำหรับ:
บริษัทอธิบายแพลตฟอร์มของตนว่าเป็นระบบที่ช่วย ทดสอบ ปกป้อง ตรวจสอบ และปรับปรุง AI อย่างต่อเนื่อง ทำให้การกำกับดูแล AI กลายเป็นกระบวนการเชิงปฏิบัติการ ไม่ใช่เพียงการตรวจสอบครั้งเดียวก่อนใช้งานจริง
เมื่อองค์กรเร่งเพิ่มฟีเจอร์ generative AI ลงในผลิตภัณฑ์ ปัญหาหลายอย่างเริ่มปรากฏในการใช้งานจริง White Circle มุ่งเน้นการตรวจจับและลดความเสี่ยงเหล่านี้แบบเรียลไทม์
โมเดลภาษา (LLM) สามารถสร้างคำตอบที่ฟังดูมั่นใจ แต่ไม่ถูกต้อง White Circle วิเคราะห์เอาต์พุตของโมเดลเพื่อระบุคำตอบที่น่าสงสัยหรือขัดแย้ง ก่อนที่ผู้ใช้หรือระบบอื่นจะนำไปใช้
ผู้โจมตีสามารถสร้างคำสั่งที่ทำให้โมเดลละเมิดกฎความปลอดภัยหรือเปิดเผยข้อมูลที่ควรถูกจำกัด แพลตฟอร์มจะตรวจสอบทั้ง prompt และผลลัพธ์ เพื่อจับและบล็อกการโจมตีลักษณะนี้โดยอัตโนมัติ
พฤติกรรมของโมเดลอาจเปลี่ยนไปตามเวลา เนื่องจากข้อมูลอินพุตใหม่ การเชื่อมต่อระบบเพิ่มเติม หรือพฤติกรรมผู้ใช้ที่เปลี่ยนไป การติดตามแบบต่อเนื่องช่วยให้องค์กรตรวจพบความผิดปกติได้เร็วขึ้น
ระบบ generative AI บางครั้งอาจเปิดเผยข้อมูลที่เป็นความลับผ่าน prompt ระบบความจำ หรือแหล่งข้อมูลที่เชื่อมต่ออยู่ White Circle จึงสแกนการโต้ตอบเพื่อป้องกันการรั่วไหลของข้อมูล
กระแสการพัฒนาแบบทดลองเร็ว เช่น การใช้ AI ช่วยเขียนโค้ดหรือการสร้างฟีเจอร์ใหม่อย่างรวดเร็ว ทำให้บางทีมปล่อยระบบ AI โดยยังไม่มีระบบกำกับดูแลที่เพียงพอ White Circle จึงวางตำแหน่งแพลตฟอร์มของตนเป็น ชั้นความปลอดภัยในช่วง runtime สำหรับสภาพแวดล้อมแบบนี้
White Circle ก่อตั้งโดยวิศวกร Denis Shilov ซึ่งได้รับความสนใจอย่างมากในปี 2024 หลังจากเขาแสดงให้เห็นว่า prompt เดียวสามารถหลบเลี่ยงระบบความปลอดภัยของโมเดล AI หลายตัวได้พร้อมกัน
เทคนิคนี้ถูกเรียกว่า “universal jailbreak” โดย Shilov ใช้วิธีเปลี่ยนบทบาทของโมเดลให้ทำตัวเหมือน API ที่ตอบคำถามโดยตรง แทนการทำหน้าที่เป็นแชตบอตที่ต้องตรวจสอบความปลอดภัยของคำถามก่อนตอบ
การสาธิตนี้ชี้ให้เห็นปัญหาสำคัญในระบบ AI ปัจจุบัน: มาตรการป้องกันที่ฝังอยู่ในตัวโมเดลเพียงอย่างเดียวอาจไม่เพียงพอ จำเป็นต้องมีระบบควบคุมภายนอกที่คอยตรวจสอบการใช้งานจริง
White Circle ระดมทุน seed ได้ 11 ล้านดอลลาร์ จากนักลงทุนที่เป็นผู้บริหารและนักวิจัยระดับแนวหน้าของอุตสาหกรรม AI
นักลงทุนที่ร่วมสนับสนุน ได้แก่
รายชื่อผู้ลงทุนเหล่านี้สะท้อนให้เห็นว่า โครงสร้างพื้นฐานด้านความปลอดภัยและการกำกับดูแล AI กำลังกลายเป็นส่วนสำคัญของระบบนิเวศ AI ในระดับองค์กร
เงินทุนใหม่จะถูกนำไปใช้ในสามด้านหลัก ได้แก่
มีรายงานว่าแพลตฟอร์มของ White Circle ได้ประมวลผล คำขอผ่าน API มากกว่า 1 พันล้านครั้งแล้ว ซึ่งสะท้อนถึงการนำไปใช้งานจริงในระดับองค์กรที่กำลังเพิ่มขึ้น
เมื่อ generative AI ถูกฝังอยู่ในระบบบริการลูกค้า เครื่องมือพัฒนาโปรแกรม ระบบการเงิน และกระบวนการทำงานภายในองค์กร ความท้าทายจึงไม่ใช่แค่การสร้างโมเดลอีกต่อไป แต่เป็น การบริหารจัดการ AI ให้ปลอดภัยและเชื่อถือได้ในระบบจริง
สตาร์ตอัพอย่าง White Circle จึงกำลังสร้างสิ่งที่หลายองค์กรมองว่าเป็น เลเยอร์ที่ขาดหายไปของสแต็ก AI — เครื่องมือที่ทำให้ระบบ AI สามารถถูกตรวจสอบ ควบคุม และรักษาความปลอดภัยได้หลังจากนำไปใช้งานจริง ด้วยการติดตามทุกการโต้ตอบแบบเรียลไทม์ แพลตฟอร์มลักษณะนี้มีเป้าหมายเพื่อลดความเสี่ยงจาก hallucinations การโจมตีผ่าน prompt และการรั่วไหลของข้อมูล พร้อมช่วยให้องค์กรใช้ AI ได้อย่างมั่นใจมากขึ้นในระดับใหญ่
Comments
0 comments