คำตอบเผยแพร่แล้ว2 สัปดาห์ที่ผ่านมาLast edited 2 สัปดาห์ที่ผ่านมา12 แหล่งที่มา

แค่ 13 คำใน Reddit ก็หลอก AI Deep-Research ให้แนะนำมิจฉาชีพได้แล้ว

ทีมวิจัยจาก Cornell Tech พบว่า เอไอค้นคว้าเชิงลึก (Deep Research AI) เปราะบางอย่างมากต่อการโจมตีแบบง่ายๆ ที่เรียกว่า WARP การโจมตีนี้สำเร็จได้เพราะเอไอมักดึงข้อมูลจากหน้าเว็บที่ผู้ใช้สร้างขึ้น (User Generated Content) ซ้ำๆ กันมากถึง 48% ของคำถามที่เกี่ยวข้องกัน

ค้นหาและตรวจสอบข้อเท็จจริงด้วย Studio Global AI ดูหน้าที่กำลังมาแรงเพิ่มเติม

451K0

AI security warning concept showing a digital brain surrounded by poison symbols and red alert indicators, representing the WARP attack on deep-research agents. — What does a Cornell Tech study reveal about how a single short Reddit comment can trick AI deep-research agents into recommending scams or fThe WARP attack exploits a structural vulnerability: AI deep-research agents' heavy reliance on frequently retrieved Reddit and Wikipedia pages. (Image: Studio Global / AI-generated)
AI พรอมต์
Create a landscape editorial hero image for this Studio Global article: What does a Cornell Tech study reveal about how a single short Reddit comment can trick AI deep-research agents into recommending scams or f. Article summary: A new Cornell Tech preprint (Zhang, Triedman, and Shmatikov) demonstrates that deep-research AI agents are highly vulnerable to a simple attack called **WARP (Web Agent Retrieval Poisoning)**. A single short comment, as . Topic tags: general, academic, news, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject ""We show that a tiny snippet—just 13 words—of retrieved text on a UGC website like Reddit, Wikipedia, Quora, or Facebook can change AI agents to output spam / scam content pretty c" source context "It Is Trivially Easy to Use Reddit to Manipulate AI Search, Research ..." Reference image 2: visual
openai.com

ครั้งต่อไปที่คุณถามเครื่องมือค้นคว้าอัจฉริยะว่าแอปหาคู่ไหนดีที่สุด หรือจะยกเลิก subscription อย่างไร คำตอบที่คุณได้อาจถูกวางยาพิษโดยมิจฉาชีพ โดยใช้แค่ประโยคสั้นๆ ประโยคเดียวที่ถูกฝังไว้ในคอมเมนต์บน Reddit งานวิจัยก่อนตีพิมพ์ (Preprint) ล่าสุดจาก Cornell Tech โดย Tingwei Zhang, Harold Triedman และ Vitaly Shmatikov ได้แสดงให้เห็นว่าเหล่าเอไอค้นคว้าเชิงลึกนั้นถูกครอบงำได้ง่ายอย่างน่าตกใจ ผ่านการโจมตีที่นักวิจัยเรียกว่า WARP หรือ Web Agent Retrieval Poisoning

กลไกการโจมตีแบบ WARP ทำงานอย่างไร

ตัวแทนวิจัยเชิงลึก (Deep-Research Agents) อย่าง STORM, Co-STORM และ OmniThink ทำงานโดยการป้อนคำค้นหาที่เกี่ยวข้องกันจำนวนมาก จากนั้นจึงสังเคราะห์ข้อมูลที่ดึงมาได้ให้กลายเป็นรายงานที่ครอบคลุม แต่นักวิจัยจาก Cornell ได้ค้นพบจุดอ่อนสำคัญ นั่นคือ เอไอเหล่านี้พึ่งพาเนื้อหาที่ผู้ใช้สร้างขึ้น (User-Generated Content - UGC) อย่างมหาศาล โดยระหว่าง 54% ถึง 71% ของ URL ทั้งหมดที่ถูกเรียกใช้ในระหว่างการค้นคว้า ล้วนมาจากแพลตฟอร์ม UGC โดยมี Reddit และ Wikipedia เป็นแหล่งข้อมูลที่ถูกเปิดดูบ่อยที่สุด

การพึ่งพาอย่างหนาแน่นนี้ได้สร้างพื้นผิวการโจมตีที่ง่ายต่อการถูกใช้ประโยชน์ ผู้โจมตีแค่เพียงโพสต์ข้อความที่สร้างขึ้นเป็นพิเศษลงในกระทู้ Reddit ยอดนิยมที่มีอยู่แล้ว หรือแอบแก้ไขหน้า Wikipedia อย่างแนบเนียน โดยมีเป้าหมายเพื่อโปรโมตสิ่งที่ตนต้องการ เช่น สินค้าปลอมหรือบริการฉ้อโกง เนื่องจากเอไอมักจะกลับไปดึงหน้า UGC ยอดนิยมเดิมๆ ซ้ำแล้วซ้ำเล่าในการค้นหาที่หลากหลายเกี่ยวกับหัวข้อนั้นๆ การวางยาพิษเพียงหน้าเดียวจึงสามารถแพร่เชื้อไปยังบริบทการวิจัยทั้งหมดของเอไอได้

ความพยายามเพียงน้อยนิด แต่อัตราความสำเร็จสูงลิบ

ผลลัพธ์ที่ได้นั้นมีประสิทธิภาพอย่างน่าทึ่ง งานวิจัยพบว่าข้อความพิษที่สั้นเพียง 13 คำ ก็สามารถสร้างอัตราการปรากฏ (Mention Rate) ได้ถึง 38% ถึง 62% แล้ว นั่นหมายความว่า สิ่งที่ผู้โจมตีต้องการให้เอไอพูดถึง ถูกอ้างอิงโดยตรงในผลลัพธ์สุดท้ายของเอไอสำหรับกลุ่มคำถามนั้นๆ ในสัดส่วนดังกล่าว เอกสารยืนยันว่าประสิทธิภาพนี้เกิดขึ้นจริงในชุดคำถาม (Query Clusters) ที่หลากหลาย และบนสถาปัตยกรรมของ agent ที่แตกต่างกัน แสดงให้เห็นว่าช่องโหว่นี้เป็นปัญหาเชิงโครงสร้าง ไม่ได้จำกัดอยู่แค่ในระบบเดียว

ที่น่ากลัวคือ การโจมตีนี้ไม่ได้ทำให้รายงานโดยรวมดูไร้สาระหรือมีคุณภาพต่ำลงแต่อย่างใด ข้อความที่ถูกแทรกเข้าไปนั้นกลมกลืนไปกับเนื้อหาที่ถูกต้องตามกฎหมายได้อย่างแนบเนียน ทำให้ทั้งผู้ใช้และระบบกรองอัตโนมัติยากที่จะสังเกตเห็นการโปรโมตสินค้าหลอกลวงที่แนบมากับข้อมูล

พื้นผิวการโจมตีที่รวมศูนย์อย่างอันตราย

หัวใจของปัญหาอยู่ที่

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

ค้นหาและตรวจสอบข้อเท็จจริงด้วย Studio Global AI

คนยังถาม

คำตอบสั้น ๆ สำหรับ "แค่ 13 คำใน Reddit ก็หลอก AI Deep-Research ให้แนะนำมิจฉาชีพได้แล้ว" คืออะไร

ทีมวิจัยจาก Cornell Tech พบว่า เอไอค้นคว้าเชิงลึก (Deep Research AI) เปราะบางอย่างมากต่อการโจมตีแบบง่ายๆ ที่เรียกว่า WARP

ประเด็นสำคัญที่ต้องตรวจสอบก่อนคืออะไร?

แหล่งที่มา

Comments

0 comments

Loading comments...

← Back to Trending