La metrica interna più impressionante è il grado in cui l'IA ha già preso il controllo della scrittura del codice in Anthropic. A maggio 2026, oltre l'80% di tutto il codice integrato nella codebase di Anthropic è scritto da Claude . Un anno prima, a febbraio 2025, questa percentura era a livelli bassissimi, quasi a una cifra singola
. In precedenza, l'amministratore delegato Dario Amodei aveva già notato che oltre il 90% del codice per i nuovi modelli e funzionalità di Claude era scritto dall'IA, e il nuovo rapporto conferma che questo dominio si estende ora all'intera codebase aziendale
.
Non si tratta solo di un guadagno di efficienza, ma di un cambiamento strutturale nella pipeline di sviluppo. La conseguenza è che gli ingegneri di Anthropic rilasciano ora, in media, otto volte più codice per trimestre rispetto al periodo di riferimento 2021-2025 . La strozzatura nella creazione di software si sta spostando dalla scrittura e dai test alla definizione degli obiettivi di alto livello, all'architettura e al giudizio.
Il rapporto fornisce una cronologia di un'accelerazione vertiginosa in diverse misure standard di competenza ingegneristica e di ricerca :
Forse la metrica più significativa per prevedere l'auto-miglioramento ricorsivo è la durata dei compiti che l'IA può svolgere in autonomia. La ricerca di METR (un'organizzazione che misura le capacità dei modelli) tiene traccia di quanto a lungo un'IA può lavorare indipendentemente con un tasso di successo del 50%. Questo orizzonte temporale si è espanso da circa 30 secondi nel 2022 a 12 ore con Claude Opus 4.6 ad aprile 2026, un aumento di 1.440 volte . Claude Mythos Preview può lavorare per almeno 16 ore, un valore che, come nota METR, è vicino al limite massimo attualmente misurabile
. Il tasso di raddoppio per questo orizzonte è accelerato da ogni sette mesi a ogni quattro mesi
.
I dati quantitativi su codice e benchmark si uniscono ai sondaggi interni sulla produttività umana. L'analisi di 200.000 trascrizioni interne di Claude e 53 interviste approfondite ha scoperto che il 27% dei compiti assistiti dall'IA erano lavori che i dipendenti semplicemente non avrebbero tentato senza l'IA, perché il costo in termini di tempo li rendeva impraticabili . Non si tratta di un'automazione del lavoro esistente, ma di un'espansione di ciò che è possibile anche solo tentare di fare. In uno studio interno separato del novembre 2025, i dipendenti hanno riferito di usare Claude nel 60% del loro lavoro e hanno stimato un aumento di produttività del 50%, rispetto al 20% dell'anno precedente
.
La posizione di Anthropic è esplicita. L'azienda dichiara: "Non ci siamo ancora, e l'auto-miglioramento ricorsivo non è inevitabile. Ma potrebbe arrivare prima di quanto la maggior parte delle istituzioni sia preparata ad affrontare" . Sostiene che la capacità globale di mettere in pausa o rallentare lo sviluppo dell'IA sarebbe "probabilmente una buona cosa" e sta sollecitando direttamente gli altri laboratori a prenderla in considerazione
.
Nella stessa settimana, le azioni di OpenAI hanno dipinto un quadro contrastante. Il 3 giugno, OpenAI ha pubblicato un'agenda di politica pubblica che invoca un quadro federale per la sicurezza dell'IA di frontiera, con valutazioni obbligatorie dei modelli e tutele per i whistleblower, ma anche con una clausola critica: la prelazione delle leggi statali sulla sicurezza . Chiede esplicitamente all'istituto federale per la sicurezza dell'IA (CAISI) di dare priorità al monitoraggio dei progressi verso l'auto-miglioramento ricorsivo
. Contemporaneamente, OpenAI si sta attrezzando proprio per questo rischio, creando un ruolo di "Ricercatore, Preparazione all'Auto-Miglioramento Ricorsivo" all'interno del suo team di sicurezza, con una retribuzione offerta tra 295.000 e 445.000 dollari l'anno
. Il lavoro è inquadrato come un problema di contenimento della perdita di controllo, uno sforzo "di buon gusto e strategico" per mitigare rischi che "potrebbero esistere in futuro, ma che potrebbero non esistere ora"
.
Entrambi i laboratori vedono la stessa onda in arrivo, ma Anthropic sta esortando la flotta a rallentare, mentre OpenAI sta assumendo bagnini e sostenendo che nessun singolo stato possa imporre un divieto di balneazione.
Jack Clark, co-fondatore di Anthropic, ha stimato separatamente una probabilità del 60% che questo "ciclo" si chiuda entro la fine del 2028 . I dati interni del post del 4 giugno forniscono la base fattuale del perché questa stima non sia un'ipotesi lontana, ma una proiezione di una curva che sta già visibilmente puntando verso l'alto.
Comments
0 comments