Per orchestrare questi modelli, Cisco ha costruito un'architettura interna chiamata Cisco Foundry Security Spec, testata su sei modelli di frontiera per garantire un funzionamento indipendente dal modello specifico. Nelle parole di Cisco, "Il modello è l'accelerante, l'architettura è il motore" .
Cisco è un membro fondatore di entrambi i principali sforzi industriali per trasformare l'IA offensiva in uno strumento di difesa informatica.
Project Glasswing di Anthropic: Lanciato ad aprile 2026, il progetto fornisce a pochi partner selezionati l'accesso a Mythos in condizioni rigidissime. L'obiettivo è trovare e correggere vulnerabilità nel software critico prima che gli hacker possano sfruttarle. Tra i partecipanti figurano colossi come AWS, Apple, Google, Microsoft, Nvidia, CrowdStrike e la Linux Foundation . Le vulnerabilità scoperte vengono comunicate ai manutentori del software in modo responsabile, attraverso un quadro di divulgazione coordinata
.
Daybreak di OpenAI: Presentato l'11 maggio 2026, è la risposta diretta di OpenAI a Glasswing. Basato su GPT-5.5 e Codex Security, offre tre livelli di accesso con un agente progettato per automatizzare la revisione del codice e la convalida delle patch su larga scala. Cisco ha aderito come partner fondatore insieme a Cloudflare, CrowdStrike e Palo Alto Networks .
Le due iniziative rappresentano una frattura filosofica. Anthropic sostiene che limitare l'accesso ai modelli più pericolosi sia il modo migliore per aumentare la sicurezza globale. OpenAI spinge per un accesso più ampio, anche a enti governativi di ogni livello, per "inondare il campo" di difensori assistiti dall'IA .
La motivazione dichiarata da Cisco è semplice: gli attacchi informatici potenziati dall'IA non sono più fantascienza e i difensori non possono più muoversi alla velocità umana. Quando Anthropic ha annunciato di aver bloccato Mythos, ha rivelato che il modello aveva già identificato debolezze in infrastrutture software critiche su cui si reggono internet e l'economia globale . Il messaggio era chiaro: se non si usano questi strumenti per primi in difesa, gli avversari li useranno per attaccare.
Cisco ha inquadrato la scansione da 1,8 miliardi di righe come una corsa contro il tempo. L'azienda ha sottolineato che questi modelli "trovano vulnerabilità su una scala mai raggiunta prima, e non si tratta di un'operazione una tantum. Continueranno a trovarne di nuove" .
Nonostante il clamore per la velocità e la scala dell'operazione, Cisco ha meticolosamente evitato di rispondere alla domanda fondamentale: quante vulnerabilità ha trovato l'IA? Diverse fonti confermano che Cisco "si è rifiutata di rivelare il numero totale" di bug scoperti, senza fornire alcun conteggio, né una suddivisione per gravità o un numero di problemi critici .
Questo silenzio crea un palese problema di credibilità. Se i modelli avessero individuato migliaia di bug gravi, comunicarlo pubblicamente avrebbe convalidato l'intera operazione—ma avrebbe anche potuto allarmare clienti e autorità di regolamentazione. Se ne avessero trovati pochi, il paragone "otto settimane contro otto anni" perderebbe di significato. Cisco ha scelto una terza via: tenere il numero segreto, lodando al contempo il "potere trasformativo" dell'IA .
Al Cisco Live 2026 è emerso anche un cambiamento concreto. A partire da luglio, Cisco abbandonerà il suo precedente modello di comunicazione delle vulnerabilità, disorganico e a spot, a favore di un approccio programmato e prevedibile. L'azienda pubblicherà gli avvisi di sicurezza il primo e il terzo mercoledì di ogni mese, con un preavviso di sette giorni che elencherà in anticipo le tecnologie e le piattaforme interessate .
La ragione è legata a doppio filo al programma di scansione IA. Il team PSIRT (Product Security Incident Response Team) di Cisco prevede che la scoperta di vulnerabilità accelerata dall'IA aumenterà significativamente il volume dei risultati. Una cadenza bisettimanale fissa è pensata per dare ai clienti aziendali la prevedibilità necessaria per pianificare i cicli di aggiornamento senza dover rispondere all'emergenza di avvisi a sorpresa .
Mentre Cisco scandagliava il proprio codice, l'Istituto per la Sicurezza dell'IA del Regno Unito (AISI) stava valutando in modo indipendente gli stessi due modelli. I risultati sono stati a dir poco preoccupanti :
Claude Mythos Preview è "sostanzialmente più capace nell'attacco informatico di qualsiasi modello precedentemente valutato". Il governo britannico ha citato questa scoperta in una lettera aperta dell'aprile 2026 a tutti i leader aziendali del Regno Unito, esortando i consigli di amministrazione a considerare il rischio informatico dell'IA una priorità assoluta di governance . Mythos ha raggiunto un tasso di successo del 73% in compiti avanzati di tipo "Capture The Flag" (CTF)
.
GPT-5.5 ha completato dall'inizio alla fine una simulazione di attacco a una rete aziendale in 32 fasi, un benchmark difficile che l'istituto stima richiederebbe a un esperto umano circa 20 ore di lavoro. Il modello ha anche saturato la suite di 95 compiti CTF utilizzata dall'AISI, rendendo i test di base obsoleti per misurare il rischio dei modelli di frontiera . Su compiti esperti avanzati, GPT-5.5 ha raggiunto un tasso di successo medio del 71% circa, contro il 69% di Mythos e il 52% della precedente generazione GPT-5.4
.
La tendenza generale sta accelerando: l'AISI ha scoperto che la capacità dei modelli di IA di completare compiti informatici in autonomia raddoppia ogni 4,7 mesi, un dato nettamente inferiore all'intervallo di 8 mesi registrato a novembre 2025. Claude Mythos e GPT-5.5 hanno addirittura superato questa tendenza già molto ripida .
Le implicazioni di un raddoppio ogni 4,7 mesi sono nette. Se il trend sarà confermato, nel giro di circa un anno e mezzo l'IA sarà in grado di completare autonomamente operazioni informatiche che oggi richiederebbero settimane a un team di esperti umani. L'AISI ha notato che le nuove versioni di entrambi i modelli hanno già reso inutile l'attuale suite di 95 test di valutazione, generando "orizzonti temporali altamente incerti" perché i benchmark non riescono più a misurare la piena estensione delle capacità .
L'annuncio di Cisco, unito alle valutazioni dell'AISI, delinea un settore che ha accettato—e sta attivamente alimentando—una corsa agli armamenti difensivi basata sull'IA. Gli stessi modelli in grado di scansionare 1,8 miliardi di righe di codice in cerca di vulnerabilità possono, in teoria, essere usati dagli attaccanti per trovare e sfruttare falle più velocemente di qualsiasi essere umano.
La logica di progetti come Glasswing e Daybreak è chiara: dare i modelli più potenti alle organizzazioni più responsabili, sotto stretto controllo, per mettere in sicurezza le infrastrutture critiche prima che queste capacità offensive si diffondano. La scansione di Cisco è il più grande test reale di questa tesi. La decisione di non rivelare il numero di bug trovati, tuttavia, lascia il resto del settore con una prova di concetto allettante ma incompleta, e con una nuova, inedita cadenza di comunicazione che suggerisce come il volume dei risultati sia stato abbastanza significativo da richiedere un cambiamento operativo permanente.
Comments
0 comments