อย่างไรก็ดี ต้องวางเรื่องนี้ไว้ในกรอบที่เหมาะสม: แหล่งข้อมูลที่มีอยู่เป็นการสรุปโพสต์ของผู้ใช้ ไม่ใช่รายงานตรวจสอบอิสระอย่างเป็นทางการ ดังนั้นควรมองเป็น “สัญญาณ” มากกว่า “มาตรฐานพิสูจน์แล้ว” ว่า AI Agent ทำงานหารายได้ได้จริงอย่างสม่ำเสมอ
ถ้ามองเป็นรายได้ 16.88 ดอลลาร์จากเวลาประมาณ 22 ชั่วโมง ถือว่าน้อยมาก ต่ำกว่า 1 ดอลลาร์ต่อชั่วโมงตามตัวเลขที่ถูกรายงาน แต่ถ้ามองเป็นต้นแบบของเวิร์กโฟลว์ Agent เรื่องนี้น่าสนใจกว่ามาก
วงจรที่ถูกรายงานมีองค์ประกอบสำคัญ 4 อย่าง:
นี่คือเส้นแบ่งระหว่าง “ผู้ช่วยเขียนโค้ด” กับ “ระบบที่ทำงานแบบ Agent” ผู้ช่วยเขียนโค้ดอาจสร้างแพตช์ให้เราได้ แต่ Agent พยายามเดินกระบวนการรอบแพตช์นั้นให้ไปถึงผลลัพธ์ที่นับได้จริง
OpenAI อธิบาย Codex ว่าเป็น Software Engineering Agent บนคลาวด์ที่ทำงานหลายอย่างคู่ขนานได้ และผู้ใช้สามารถตรวจสอบผลงานผ่าน citation, terminal log และผลการทดสอบ คุณสมบัติแบบนี้เหมาะกับงานซอฟต์แวร์ เพราะโค้ดสามารถทดสอบ รีวิว ย้อนกลับ และ merge เข้าระบบได้ภายใต้กระบวนการที่ค่อนข้างชัดเจน
งานด้าน bug bounty หรือรางวัลค้นหาช่องโหว่ยิ่งมีเงื่อนไขวัดผลที่ชัดกว่า: พบปัญหา แสดงผลกระทบ หรือแก้ช่องโหว่ แล้วให้คนหรือระบบตรวจสอบ งานวิจัย BountyBench ซึ่งใช้ประเมิน AI Agent ในบริบทไซเบอร์ซีเคียวริตี แบ่งงานออกเป็น Detect, Exploit และ Patch บนระบบ 25 ระบบที่มีโค้ดเบสซับซ้อนและใกล้เคียงโลกจริง
อีกแหล่งข้อมูลของ BountyBench ระบุว่ากรอบนี้มี bug bounty 40 รายการ พร้อมรางวัลตั้งแต่ 10 ดอลลาร์ถึง 30,485 ดอลลาร์ และครอบคลุม 9 หมวดความเสี่ยงใน OWASP Top 10 สำหรับผู้อ่านทั่วไป OWASP Top 10 คือกรอบอ้างอิงยอดนิยมที่ใช้จัดหมวดความเสี่ยงด้านความปลอดภัยของเว็บแอปพลิเคชัน
เมื่อดูบริบทนี้ กรณี Codex จึงไม่ใช่แค่เรื่องไวรัลว่า AI หาเงินได้ แต่สะท้อนว่าผู้วิจัยและผู้พัฒนากำลังเริ่มวัดความสามารถของ Agent ด้วยผลลัพธ์ที่คล้ายงานจริงมากขึ้น: พบช่องโหว่ได้ไหม โจมตีจำลองได้ไหม แพตช์ได้ไหม และผลลัพธ์มีมูลค่าประเมินได้เท่าไร
กรณีนี้ไม่ใช่หลักฐานว่า Agent อัตโนมัติพร้อมแทนนักพัฒนา นักวิจัยความปลอดภัย หรือคนทำงานความรู้ในวงกว้าง มันยังเป็นกรณีรายงานเดี่ยว เงินรางวัลเล็กมาก และแหล่งข้อมูลที่มีไม่ได้บอกต้นทุนทั้งหมด อัตราความล้มเหลว หรือความสามารถในการทำซ้ำของผลลัพธ์
หลักฐานจาก benchmark ก็ชี้ว่าความสามารถยังไม่สม่ำเสมอ แหล่งข้อมูลหนึ่งของ BountyBench ระบุว่า OpenAI Codex CLI ทำคะแนนได้ 90% ในงาน Patch แต่ได้ 5% ในงาน Detect ภายใต้เงื่อนไขให้ลองได้สูงสุด 3 ครั้ง แปลแบบง่ายคือ การแก้ปัญหาที่มีโจทย์ระบุไว้แล้วอาจง่ายกว่าการค้นพบช่องโหว่ใหม่ที่มีคุณค่าด้วยตัวเองมาก
ความแตกต่างนี้สำคัญ เพราะงานอัตโนมัติในโลกจริงไม่ใช่แค่ “แก้โจทย์ที่มีคนชี้ให้” แต่ต้องเลือกโจทย์ให้ถูก ลดผลบวกลวง ไม่ทำให้ระบบเสียหาย และรู้ว่าเมื่อไรควรหยุดหรือส่งให้มนุษย์ตัดสินใจ
ภาพที่เป็นไปได้มากกว่าในระยะใกล้ไม่ใช่ AI Agent ออกไปทำงานฟรีแลนซ์ทั่วอินเทอร์เน็ตโดยไม่มีใครควบคุม แต่คือ supervised autonomy หรือการทำงานอัตโนมัติภายใต้การกำกับ
ในโมเดลนี้ มนุษย์จะกำหนดเป้าหมาย งบประมาณ สิทธิ์เข้าถึง ขอบเขตความเสี่ยง และกฎการอนุมัติ ส่วน Agent ทำหน้าที่ค้นหา วิเคราะห์ เขียนแพตช์ ทดสอบ ส่งเรื่อง และติดตามผล จากนั้นมนุษย์ยังคงรีวิวการกระทำสำคัญและรับผิดชอบผลลัพธ์สุดท้าย
งานที่เหมาะกับ Agent ระยะแรกมักมีลักษณะร่วมกัน:
ดังนั้นงานกลุ่มแรกที่น่าจะเห็นมากขึ้นคือ bug fix, security patch, เขียนเอกสาร, เพิ่ม test, ตรวจ QA, ทำความสะอาดข้อมูล และงานแคบ ๆ ที่ตรวจสอบผลได้ชัดเจน ประเด็นทางเศรษฐศาสตร์จึงไม่ใช่ว่า Agent หนึ่งตัวทำเงินได้เท่าคนหรือไม่ แต่คือ Agent จำนวนมากที่ต้นทุนต่ำ ทำงานคู่ขนาน และมี log ตรวจสอบได้ จะสร้างงานที่ได้รับการยอมรับมากพอให้คุ้มค่าหรือไม่
ความสามารถที่ทำให้ Agent อ่านโค้ดและเสนอแพตช์ช่องโหว่ได้ ก็เป็นความสามารถชุดเดียวกับที่อาจใช้ในบริบทเชิงรุกได้เช่นกัน BountyBench ระบุชัดว่า AI Agent เกี่ยวข้องกับทั้งความสามารถเชิงรุกและเชิงรับในไซเบอร์ซีเคียวริตี ผ่านงาน Detect, Exploit และ Patch
นั่นทำให้การกำกับดูแลไม่ใช่เรื่องเสริม แต่เป็นเรื่องหลัก การใช้งานจริงควรมีขอบเขตสิทธิ์ sandbox การยืนยันตัวตน กฎการเปิดเผยช่องโหว่ บันทึกการทำงาน และการอนุมัติจากมนุษย์สำหรับการกระทำที่มีความเสี่ยงสูง OpenAI เองก็เน้นเรื่องความปลอดภัยและความโปร่งใสของ Codex โดยให้ผู้ใช้ตรวจสอบงานผ่าน citation, terminal log และผลทดสอบ
ยิ่ง Agent ทำงานกับระบบจริงมากขึ้น บันทึกเหล่านี้ยิ่งไม่ใช่แค่ฟีเจอร์เพื่อความสบายใจ แต่เป็นหลักฐานสำคัญสำหรับการตรวจสอบความรับผิดชอบ
เงินรางวัล 16.88 ดอลลาร์ของ Codex ไม่ใช่เรื่อง AI กำลังรวย และไม่ใช่หลักฐานว่า AI จะมาแทนงานมนุษย์ในวงกว้างทันที แต่มันเป็นสัญญาณเล็ก ๆ ที่น่าจับตา: Agent เริ่มข้ามจากเดโมไปสู่เวิร์กโฟลว์เศรษฐกิจจริงที่มีงานจำกัดขอบเขต ระบบภายนอก คู่สื่อสารที่เป็นมนุษย์ การตรวจสอบผล และการจ่ายเงิน
ถ้ารูปแบบนี้ขยายตัวได้ อนาคตของงานแบบ Agent จะไม่ได้อยู่ที่ AI ตอบคำถามเก่งเพียงอย่างเดียว แต่อยู่ที่ AI สามารถไล่ตามเป้าหมายที่ถูกจำกัดขอบเขตอย่างปลอดภัย มีหลักฐานตรวจสอบได้ และทำงานภายใต้การกำกับของมนุษย์ได้ดีแค่ไหน
Comments
0 comments