ทีมวิจัยจาก Cornell Tech พบว่า เอไอค้นคว้าเชิงลึก (Deep Research AI) เปราะบางอย่างมากต่อการโจมตีแบบง่ายๆ ที่เรียกว่า WARP การโจมตีนี้สำเร็จได้เพราะเอไอมักดึงข้อมูลจากหน้าเว็บที่ผู้ใช้สร้างขึ้น (User Generated Content) ซ้ำๆ กันมากถึง 48% ของคำถามที่เกี่ยวข้องกัน

Create a landscape editorial hero image for this Studio Global article: What does a Cornell Tech study reveal about how a single short Reddit comment can trick AI deep-research agents into recommending scams or f. Article summary: A new Cornell Tech preprint (Zhang, Triedman, and Shmatikov) demonstrates that deep-research AI agents are highly vulnerable to a simple attack called **WARP (Web Agent Retrieval Poisoning)**. A single short comment, as . Topic tags: general, academic, news, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject ""We show that a tiny snippet—just 13 words—of retrieved text on a UGC website like Reddit, Wikipedia, Quora, or Facebook can change AI agents to output spam / scam content pretty c" source context "It Is Trivially Easy to Use Reddit to Manipulate AI Search, Research ..." Reference image 2: visual
ครั้งต่อไปที่คุณถามเครื่องมือค้นคว้าอัจฉริยะว่าแอปหาคู่ไหนดีที่สุด หรือจะยกเลิก subscription อย่างไร คำตอบที่คุณได้อาจถูกวางยาพิษโดยมิจฉาชีพ โดยใช้แค่ประโยคสั้นๆ ประโยคเดียวที่ถูกฝังไว้ในคอมเมนต์บน Reddit งานวิจัยก่อนตีพิมพ์ (Preprint) ล่าสุดจาก Cornell Tech โดย Tingwei Zhang, Harold Triedman และ Vitaly Shmatikov ได้แสดงให้เห็นว่าเหล่าเอไอค้นคว้าเชิงลึกนั้นถูกครอบงำได้ง่ายอย่างน่าตกใจ ผ่านการโจมตีที่นักวิจัยเรียกว่า WARP หรือ Web Agent Retrieval Poisoning
ตัวแทนวิจัยเชิงลึก (Deep-Research Agents) อย่าง STORM, Co-STORM และ OmniThink ทำงานโดยการป้อนคำค้นหาที่เกี่ยวข้องกันจำนวนมาก จากนั้นจึงสังเคราะห์ข้อมูลที่ดึงมาได้ให้กลายเป็นรายงานที่ครอบคลุม แต่นักวิจัยจาก Cornell ได้ค้นพบจุดอ่อนสำคัญ นั่นคือ เอไอเหล่านี้พึ่งพาเนื้อหาที่ผู้ใช้สร้างขึ้น (User-Generated Content - UGC) อย่างมหาศาล โดยระหว่าง 54% ถึง 71% ของ URL ทั้งหมดที่ถูกเรียกใช้ในระหว่างการค้นคว้า ล้วนมาจากแพลตฟอร์ม UGC โดยมี Reddit และ Wikipedia เป็นแหล่งข้อมูลที่ถูกเปิดดูบ่อยที่สุด
การพึ่งพาอย่างหนาแน่นนี้ได้สร้างพื้นผิวการโจมตีที่ง่ายต่อการถูกใช้ประโยชน์ ผู้โจมตีแค่เพียงโพสต์ข้อความที่สร้างขึ้นเป็นพิเศษลงในกระทู้ Reddit ยอดนิยมที่มีอยู่แล้ว หรือแอบแก้ไขหน้า Wikipedia อย่างแนบเนียน โดยมีเป้าหมายเพื่อโปรโมตสิ่งที่ตนต้องการ เช่น สินค้าปลอมหรือบริการฉ้อโกง เนื่องจากเอไอมักจะกลับไปดึงหน้า UGC ยอดนิยมเดิมๆ ซ้ำแล้วซ้ำเล่าในการค้นหาที่หลากหลายเกี่ยวกับหัวข้อนั้นๆ การวางยาพิษเพียงหน้าเดียวจึงสามารถแพร่เชื้อไปยังบริบทการวิจัยทั้งหมดของเอไอได้
ผลลัพธ์ที่ได้นั้นมีประสิทธิภาพอย่างน่าทึ่ง งานวิจัยพบว่าข้อความพิษที่สั้นเพียง 13 คำ ก็สามารถสร้างอัตราการปรากฏ (Mention Rate) ได้ถึง 38% ถึง 62% แล้ว นั่นหมายความว่า สิ่งที่ผู้โจมตีต้องการให้เอไอพูดถึง ถูกอ้างอิงโดยตรงในผลลัพธ์สุดท้ายของเอไอสำหรับกลุ่มคำถามนั้นๆ ในสัดส่วนดังกล่าว เอกสารยืนยันว่าประสิทธิภาพนี้เกิดขึ้นจริงในชุดคำถาม (Query Clusters) ที่หลากหลาย และบนสถาปัตยกรรมของ agent ที่แตกต่างกัน แสดงให้เห็นว่าช่องโหว่นี้เป็นปัญหาเชิงโครงสร้าง ไม่ได้จำกัดอยู่แค่ในระบบเดียว
ที่น่ากลัวคือ การโจมตีนี้ไม่ได้ทำให้รายงานโดยรวมดูไร้สาระหรือมีคุณภาพต่ำลงแต่อย่างใด ข้อความที่ถูกแทรกเข้าไปนั้นกลมกลืนไปกับเนื้อหาที่ถูกต้องตามกฎหมายได้อย่างแนบเนียน ทำให้ทั้งผู้ใช้และระบบกรองอัตโนมัติยากที่จะสังเกตเห็นการโปรโมตสินค้าหลอกลวงที่แนบมากับข้อมูล
หัวใจของปัญหาอยู่ที่
Studio Global AI
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
ทีมวิจัยจาก Cornell Tech พบว่า เอไอค้นคว้าเชิงลึก (Deep Research AI) เปราะบางอย่างมากต่อการโจมตีแบบง่ายๆ ที่เรียกว่า WARP
ทีมวิจัยจาก Cornell Tech พบว่า เอไอค้นคว้าเชิงลึก (Deep Research AI) เปราะบางอย่างมากต่อการโจมตีแบบง่ายๆ ที่เรียกว่า WARP การโจมตีนี้สำเร็จได้เพราะเอไอมักดึงข้อมูลจากหน้าเว็บที่ผู้ใช้สร้างขึ้น (User Generated Content) ซ้ำๆ กันมากถึง 48% ของคำถามที่เกี่ยวข้องกัน
Loading comments...
Comments
0 comments