OpenAI ha rilasciato la versione completa di GPT-5.5-Cyber, inizialmente disponibile solo in anteprima limitata, attraverso un accesso controllato riservato a difensori fidati . Il modello ha registrato progressi significativi rispetto al GPT-5.5 standard nei benchmark specifici per la cybersecurity:
Secondo il Preparedness Framework di OpenAI, GPT-5.5 ha ricevuto una classificazione di capacità cybersecurity 'Alta', rimanendo al di sotto della soglia 'Critica', definita come la capacità di sviluppare exploit zero-day in modo autonomo senza aiuto umano . In una misurazione specifica, GPT-5.5 (e la variante Cyber) ha completato una simulazione di attacco di rete in 32 fasi, risultando essere solo il secondo modello AI a riuscirci, dopo Mythos di Anthropic
.
OpenAI ha lanciato un plugin Codex Security aggiornato che integra la scoperta, la validazione e la correzione delle vulnerabilità direttamente nel flusso di lavoro dello sviluppatore all'interno di Codex . Il plugin è progettato per andare oltre l'analisi statica: è in grado di costruire o inferire un modello di minaccia, identificare vulnerabilità plausibili, determinare se il codice interessato è raggiungibile, raccogliere prove di validazione, sviluppare patch mirate e verificare il risultato
. OpenAI afferma che il plugin incorpora le lezioni apprese dall'uso interno e da parte dei clienti per accelerare la ricerca e la correzione delle vulnerabilità nei sistemi esistenti, oltre ad aiutare a prevenirne di nuove prima che arrivino in produzione
. Dalla sua anteprima di ricerca di marzo 2026, il plugin Codex Security ha già scansionato oltre 30 milioni di commit in più di 30.000 codebase, con revisori umani che hanno contrassegnato manualmente oltre 70.000 risultati
.
Patch the Planet è l'iniziativa open-source centrale nell'espansione Daybreak, sviluppata in collaborazione con Trail of Bits, HackerOne e Calif . OpenAI lo descrive come 'uno sforzo per aiutare i manutentori open-source a passare dai risultati di sicurezza alle correzioni unite' con la revisione umana al centro
. Il programma finanzia ingegneri della sicurezza dedicati di Trail of Bits che lavorano a tempo pieno con Codex e GPT-5.5-Cyber su progetti open-source, con l'obiettivo non solo di trovare bug, ma anche di scrivere e inviare patch unite
.
Trail of Bits ha organizzato uno sprint di apertura di cinque giorni con 25 ingegneri che hanno lavorato direttamente con i manutentori open-source . Risultati su 19 progetti (con oltre 30 che hanno promesso la partecipazione)
:
Esempi notevoli di risultati includono 8 proof-of-concept di pointer-leak nel kernel Linux, 24 vettori di escalation dei privilegi locali in utility di sistema, oltre 10 vulnerabilità Safari sfruttabili, una CVE di Firefox WebAssembly (CVE-2026-8390) corretta prima di Pwn2Own, e quattro delle sei CVE di dnsmasq segnalate in modo indipendente prima della loro correzione pubblica . I progetti coperti includevano cURL, NATS, pyca/cryptography, Sigstore, aiohttp, il progetto Go, freenginx, Python e python.org, urllib3, PyPI, SimpleX, Valkey e RustCrypt
. Gli ingegneri di Trail of Bits hanno utilizzato esecuzioni ripetute di Codex
/goal con GPT-5.5-Cyber per costruire un intero laboratorio di fuzzing che copre dozzine di punti di ingresso, piattaforme e nuovi seed di test in meno di una settimana — un compito che, secondo le loro stime, normalmente richiederebbe almeno diverse settimane .
I manutentori partecipanti ricevono anche sei mesi di ChatGPT Pro da OpenAI, incluso l'accesso condizionale a Codex Security per codifica, automazioni e flussi di lavoro .
OpenAI ha lanciato il Daybreak Cyber Partner Program, un'iniziativa su invito che offre ai vendor di sicurezza l'accesso alle capacità cyber all'avanguardia di OpenAI (incluso GPT-5.5 con Trusted Access) per integrarle nei propri prodotti e servizi . Il programma mira a 'alimentare prodotti costruiti sulle nostre migliori capacità cyber per le principali aziende di sicurezza per proteggere il software del mondo'
.
Un elenco più ampio di partner precedenti, risalente al lancio di Daybreak del maggio 2026, includeva anche Cloudflare, Oracle, Zscaler, Akamai, Fortinet, Intel, Qualys, Rapid7, Trail of Bits, SpecterOps, SentinelOne, Netskope, Snyk, Gen Digital, Semgrep e Socket .
L'espansione posiziona direttamente Daybreak di OpenAI contro Project Glasswing di Anthropic e il suo modello Mythos AI. Sulla base delle prove disponibili, i due sforzi differiscono nella strategia e presentano un panorama competitivo fluido:
Nel complesso, le due aziende si alternano al comando in diversi benchmark e domini di capacità. L'enfasi di OpenAI sulla democratizzazione — patching open-source, ampie integrazioni con partner e strumenti integrati per sviluppatori — contrasta con la strategia di implementazione più controllata e focalizzata sull'élite di Anthropic. Entrambi i modelli rimangono all'avanguardia nei rispettivi punti di forza e le dinamiche competitive sono destinate a continuare ad evolversi.
Comments
0 comments