Це не просто підвищення ефективності; це структурний зсув у процесі розробки. Як наслідок, інженери Anthropic тепер постачають у вісім разів більше коду за квартал порівняно з базовим рівнем 2021–2025 років . Вузьке місце у створенні програмного забезпечення зміщується від написання та тестування до визначення цілей вищого рівня, архітектури та суджень.
Звіт наводить хронологію карколомного прискорення за кількома стандартними показниками інженерної та дослідницької компетентності :
Чи не найвагомішим показником для прогнозування рекурсивного самовдосконалення є тривалість автономних завдань. Дослідження METR відстежує, як довго ШІ може працювати незалежно з 50% ймовірністю успіху. Цей часовий горизонт розширився з приблизно 30 секунд у 2022 році до 12 годин з Claude Opus 4.6 у квітні 2026 року — збільшення в 1440 разів . Claude Mythos Preview може працювати щонайменше 16 годин, що, як зазначається, є близьким до верхньої межі того, що METR наразі може виміряти
. Швидкість подвоєння цього горизонту прискорилася з кожних семи місяців до кожних чотирьох
.
Кількісні дані щодо коду та бенчмарків доповнюються внутрішніми опитуваннями щодо продуктивності людей. Аналіз 200 000 внутрішніх транскриптів Claude та 53 глибинних інтерв’ю показав, що 27% завдань, виконаних за допомогою ШІ, були роботою, яку співробітники просто не стали б виконувати без нього, оскільки витрати часу раніше робили її недоцільною . Це не автоматизація існуючої роботи, а розширення того, що взагалі можливо спробувати зробити. В окремому внутрішньому дослідженні в листопаді 2025 року співробітники повідомили, що використовують Claude у 60% своєї роботи та оцінили підвищення продуктивності у 50%, порівняно з 20% роком раніше
.
Позиція Anthropic чітка. Компанія заявляє: «Ми ще не там, і рекурсивне самовдосконалення не є неминучим. Але воно може настати раніше, ніж більшість інституцій готові» . Вона стверджує, що глобальна здатність призупинити або уповільнити розвиток ШІ була б «ймовірно, хорошою річчю», і прямо закликає інші лабораторії розглянути це
.
Того ж тижня дії OpenAI намалювали контрастну картину. 3 червня OpenAI опублікувала порядок денний державної політики, закликаючи до федеральної системи безпеки для передового ШІ з обов’язковим оцінюванням моделей та захистом викривачів, але також із критичним застереженням: пріоритет федерального закону над законами штатів про безпеку . Вона прямо просить федеральний інститут безпеки ШІ CAISI пріоритезувати моніторинг прогресу в напрямку рекурсивного самовдосконалення
. Водночас OpenAI набирає персонал саме для цього ризику, створюючи посаду «Дослідник, готовність до рекурсивного самовдосконалення» у своїй команді безпеки із заявленою компенсацією від $295 000 до $445 000
. Робота сформульована як проблема стримування втрати контролю, «вишукане та стратегічне» зусилля для пом'якшення ризиків, які «можуть існувати в майбутньому, але можуть не існувати зараз»
.
Обидві лабораторії бачать наближення однієї хвилі, але Anthropic закликає флот уповільнити хід, тоді як OpenAI наймає рятувальників і виступає проти того, щоб окремий штат оголошував заборону на купання.
Comments
0 comments