Bu sadece bir verimlilik artışı değil; geliştirme sürecinde yapısal bir değişimi temsil ediyor. Bunun sonucu olarak, Anthropic mühendisleri artık 2021–2025 dönemine kıyasla çeyrek başına sekiz kat daha fazla kod teslim ediyor . Yazılım oluşturmadaki darboğaz, yazma ve test etmeden, daha üst düzey hedef belirleme, mimari ve muhakemeye doğru kayıyor.
Rapor, mühendislik ve araştırma yetkinliğinin çeşitli standart ölçütlerinde baş döndürücü bir ivmelenmenin zaman çizelgesini sunuyor :
Özyinelemeli kendini iyileştirmeyi tahmin etmek için belki de en etkili ölçüt, otonom görevlerin süresi. METR'in araştırması, bir yapay zekanın %50 başarı oranıyla ne kadar süre bağımsız çalışabileceğini takip ediyor. Bu görev ufku, 2022'de yaklaşık 30 saniyeden, Nisan 2026'da Claude Opus 4.6 ile 12 saate genişledi; bu 1.440 katlık bir artış anlamına geliyor . Claude Mythos Preview en az 16 saat çalışabiliyor ve bunun şu anda METR'in ölçebildiği üst sınıra yakın olduğu belirtiliyor
. Bu ufkun ikiye katlanma hızı her yedi aydan her dört aya hızlandı
.
Kod ve kıyaslamalara dair nicel veriler, insan üretkenliği üzerine yapılan şirket içi anketlerle birleştiriliyor. 200.000 dahili Claude transkriptinin ve 53 derinlemesine görüşmenin analizi, yapay zeka destekli görevlerin %27'sinin, çalışanların yapay zeka olmadan kesinlikle girişmeyeceği işler olduğunu, çünkü zaman maliyetinin bunları daha önce pratik olmaktan çıkardığını ortaya koydu . Bu, mevcut işin otomasyonu değil, neyin denenebilir olduğuna dair sınırların genişlemesidir. Kasım 2025'te yapılan ayrı bir şirket içi çalışmada, çalışanlar işlerinin %60'ında Claude kullandıklarını ve bir önceki yılki %20'lik orana kıyasla %50 üretkenlik artışı tahmin ettiklerini bildirdi
.
Anthropic'in tutumu net. Şirket, "Henüz o noktada değiliz ve özyinelemeli kendini iyileştirme kaçınılmaz değil. Ancak çoğu kurumun hazır olduğundan daha erken gelebilir" diyor . Yapay zeka gelişimini durduracak veya yavaşlatacak küresel bir yeteneğin "muhtemelen iyi bir şey" olacağını savunuyor ve doğrudan diğer laboratuvarları bunu düşünmeye çağırıyor
.
Aynı hafta, OpenAI'ın eylemleri tam tersi bir tablo çizdi. 3 Haziran'da OpenAI, zorunlu model değerlendirmeleri ve ihbarcı korumaları içeren, ancak kritik bir madde de barındıran federal bir uç yapay zeka güvenlik çerçevesi çağrısı yapan bir kamu politika gündemi yayınladı: eyalet düzeyindeki güvenlik yasalarının federal yasa tarafından geçersiz kılınması . Federal yapay zeka güvenlik enstitüsü CAISI'den özyinelemeli kendini iyileştirmeye yönelik ilerlemeyi izlemeye öncelik vermesini açıkça talep ediyor
. Eş zamanlı olarak OpenAI, tam da bu risk için kadro kuruyor ve güvenlik ekibi bünyesinde 295.000 ila 445.000 dolar arasında bir maaşla "Araştırmacı, Özyinelemeli Kendini İyileştirme Hazırlığı" rolü oluşturuyor
. İş, bir kontrol kaybı kontrol altına alma sorunu olarak çerçevelendiriliyor; "gelecekte var olabilecek, ancak şu anda var olmayabilecek" riskleri azaltmak için "zevkli ve stratejik" bir çaba
.
Her iki laboratuvar da aynı dalganın yaklaştığını görüyor, ancak Anthropic filoyu yavaşlamaya çağırırken, OpenAI cankurtaranları işe alıyor ve herhangi bir eyaletin yüzme yasağı koymasına karşı çıkıyor.
Anthropic'in kurucu ortağı Jack Clark, ayrı olarak bu "döngünün" 2028'in sonuna kadar kapanması için %60 olasılık tahmin etmişti . 4 Haziran tarihli yazıdaki şirket içi veriler, bu tahminin neden uzak bir varsayım değil, halihazırda gözle görülür şekilde yukarı doğru kıvrılan bir eğriden yapılan bir projeksiyon olduğuna dair olgusal temeli sağlıyor.
Comments
0 comments