นี่ไม่ใช่แค่การเพิ่มประสิทธิภาพ แต่มันแสดงถึงการเปลี่ยนแปลงเชิงโครงสร้างในขั้นตอนการพัฒนา ผลที่ตามมาคือวิศวกรของ Anthropic กำลังผลิตโค้ดได้มากขึ้นถึงแปดเท่าต่อไตรมาสเมื่อเทียบกับช่วงพื้นฐานปี 2021–2025 คอขวดในการสร้างซอฟต์แวร์กำลังเปลี่ยนจากการเขียนและการทดสอบ ไปสู่การตั้งเป้าหมายระดับสูง การออกแบบสถาปัตยกรรม และการใช้วิจารณญาณ
รายงานระบุเส้นเวลาของการเร่งความเร็วที่เพิ่มขึ้นอย่างก้าวกระโดดในการวัดความสามารถทางวิศวกรรมและการวิจัยหลายมาตรฐาน :
บางทีตัวชี้วัดที่มีผลกระทบมากที่สุดสำหรับการทำนายการพัฒนาตัวเองแบบวนซ้ำคือระยะเวลาของงานอัตโนมัติ งานวิจัยจาก METR ติดตามว่า AI สามารถทำงานอย่างอิสระได้นานแค่ไหนที่อัตราความสำเร็จ 50% ขีดจำกัดนี้ได้ขยายจากประมาณ 30 วินาทีในปี 2022 เป็น 12 ชั่วโมงด้วย Claude Opus 4.6 ภายในเดือนเมษายน 2026 ซึ่งเพิ่มขึ้น 1,440 เท่า Claude Mythos Preview สามารถทำงานได้อย่างน้อย 16 ชั่วโมง ซึ่งมีการบันทึกว่าใกล้ถึงขีดจำกัดสูงสุดที่ METR สามารถวัดได้ในปัจจุบัน
อัตราการเพิ่มขึ้นเท่าตัวสำหรับขีดจำกัดนี้เร่งจากทุกๆ เจ็ดเดือนเป็นทุกๆ สี่เดือน
ข้อมูลเชิงปริมาณเกี่ยวกับโค้ดและมาตรวัดถูกประกอบเข้ากับการสำรวจภายในเกี่ยวกับประสิทธิภาพการทำงานของมนุษย์ การวิเคราะห์บทสนทนาภายในของ Claude จำนวน 200,000 รายการ และการสัมภาษณ์เชิงลึก 53 ครั้งพบว่า 27% ของงานที่ใช้ AI ช่วยเหลือเป็นงานที่พนักงานคงไม่มีทางทำหากไม่มี AI เพราะต้นทุนด้านเวลาทำให้มันไม่คุ้มค่ามาก่อน นี่ไม่ใช่การใช้เครื่องจักรทำงานที่มีอยู่เดิม แต่เป็นการขยายขอบเขตของสิ่งที่เป็นไปได้ที่จะลองทำ การศึกษาภายในอีกชิ้นหนึ่งในเดือนพฤศจิกายน 2025 พนักงานรายงานว่าใช้ Claude ใน 60% ของงานของพวกเขา และประเมินว่าประสิทธิภาพเพิ่มขึ้น 50% ซึ่งเพิ่มขึ้นจาก 20% ในปีก่อนหน้า
จุดยืนของ Anthropic นั้นชัดเจน บริษัทระบุว่า "เรายังไม่ถึงจุดนั้น และการพัฒนาตัวเองแบบวนซ้ำไม่ใช่สิ่งที่หลีกเลี่ยงไม่ได้ แต่มันอาจมาถึงเร็วกว่าที่สถาบันส่วนใหญ่เตรียมพร้อมรับมือ" และให้เหตุผลว่าความสามารถระดับโลกในการหยุดหรือชะลอการพัฒนา AI "น่าจะเป็นสิ่งที่ดี" และกำลังเรียกร้องให้ห้องปฏิบัติการอื่นๆ พิจารณาเรื่องนี้โดยตรง
ในสัปดาห์เดียวกัน การกระทำของ OpenAI ได้วาดภาพที่ตรงกันข้าม ในวันที่ 3 มิถุนายน OpenAI ได้เผยแพร่วาระนโยบายสาธารณะเรียกร้องให้มีกรอบความปลอดภัย AI ชายแดนของรัฐบาลกลาง ด้วยการประเมินโมเดลภาคบังคับและการคุ้มครองผู้แจ้งเบาะแส แต่ก็มีข้อกำหนดสำคัญคือการยึดอำนาจเหนือกฎหมายความปลอดภัยระดับรัฐ มันขอให้ CAISI ซึ่งเป็นสถาบันความปลอดภัย AI ของรัฐบาลกลาง ให้ความสำคัญกับการติดตามความคืบหน้าสู่การพัฒนาตัวเองแบบวนซ้ำ
ในขณะเดียวกัน OpenAI กำลังเพิ่มบุคลากรเพื่อรับมือกับความเสี่ยงนี้ โดยสร้างตำแหน่ง "นักวิจัย การเตรียมพร้อมสำหรับการพัฒนาตัวเองแบบวนซ้ำ" ภายในทีมความปลอดภัย ด้วยค่าตอบแทนที่ประกาศไว้ที่ 295,000 ถึง 445,000 ดอลลาร์สหรัฐ
งานนี้ถูกวางกรอบว่าเป็นปัญหาการควบคุมการสูญเสียการควบคุม ซึ่งเป็นความพยายาม "ที่เหมาะสมและมียุทธศาสตร์" เพื่อลดความเสี่ยงที่ "อาจมีอยู่ในอนาคต แต่อาจไม่มีอยู่ในตอนนี้"
ทั้งสองห้องปฏิบัติการมองเห็นคลื่นลูกใหญ่ลูกเดียวกันกำลังซัดเข้ามา แต่ Anthropic กำลังกระตุ้นให้กองเรือทั้งหมดชะลอความเร็ว ในขณะที่ OpenAI กำลังจ้างไลฟ์การ์ดและโต้แย้งกับการที่รัฐใดรัฐหนึ่งจะออกคำสั่งห้ามว่ายน้ำ
Jack Clark ผู้ร่วมก่อตั้ง Anthropic ได้ประเมินแยกต่างหากว่ามีความน่าจะเป็น 60% ที่ "วงจร" นี้จะปิดลงภายในสิ้นปี 2028 ข้อมูลภายในในโพสต์วันที่ 4 มิถุนายนให้หลักฐานที่เป็นรูปธรรมว่าเหตุใดการประเมินนั้นจึงไม่ใช่สมมติฐานที่ห่างไกล แต่เป็นการคาดการณ์จากกราฟเส้นโค้งที่กำลังโค้งตัวขึ้นอย่างเห็นได้ชัด
Comments
0 comments