S'exprimant auprès de médias comme la BBC et Moneycontrol, Palmiotti a expliqué que la technologie évolue à un rythme où même l'élite des talents humains pourrait devenir non compétitive. Elle prédit que les concours de hacking d'IA pourraient rendre obsolètes des compétitions comme Pwn2Own, car la vitesse brute, l'échelle et l'autonomie de systèmes comme Mythos sont hors d'atteinte pour tout humain, aussi doué soit-il .
Fait crucial, elle ne prétend pas que l'IA remplacera instantanément tous les chercheurs en sécurité. Elle avertit plutôt qu'un seuil de capacité est en train d'être franchi, ce qui change radicalement l'équation économique de qui — ou quoi — trouve en premier les vulnérabilités les plus critiques. La trajectoire, selon elle, tend inexorablement vers les machines .
Claude Mythos Preview n'est pas un outil de cybersécurité spécialisé. C'est un modèle de langage généraliste, le successeur nouvelle génération d'Anthropic à sa gamme Claude. Il n'a pas été spécifiquement entraîné pour le hacking. Pourtant, lorsque ses capacités ont été évaluées, les résultats ont choqué jusqu'à ses créateurs .
Anthropic a confirmé que Mythos Preview a découvert de manière autonome des milliers de vulnérabilités de haute sévérité sur tous les principaux systèmes d'exploitation et navigateurs web. Cela inclut des failles zero-day (jusqu'alors inconnues) qu'aucun chercheur humain n'avait encore repérées . Un rapport décrit le modèle produisant 303 pages de résultats de vulnérabilités en 21 minutes
.
Les précédents modèles d'IA pouvaient parfois trouver des vulnérabilités, mais ne parvenaient presque jamais à construire un exploit de manière autonome. Sur un benchmark consistant à transformer des vulnérabilités connues du moteur JavaScript de Firefox en exploits shell fonctionnels, Mythos Preview a réussi 181 fois. Le précédent meilleur modèle d'Anthropic, Claude Opus 4.6, affichait un taux de succès proche de zéro . Il ne s'agit pas d'une amélioration incrémentale — c'est un seuil décisif qui est franchi
.
Mythos peut analyser des logiciels closed-source ou compilés, même après que les données de débogage lisibles par l'humain en ont été retirées. Il examine le code machine brut, comprend le fonctionnement du programme et découvre des vulnérabilités qui seraient opaques sans accès au code source .
Les chercheurs ont utilisé un cadre simple : isoler le code cible dans un conteneur, invoquer le modèle avec Claude Code exécutant Mythos Preview, et lui donner un simple paragraphe d'instructions lui demandant de trouver des vulnérabilités. Le modèle a alors identifié et écrit de manière indépendante des exploits pour des failles de sécurité jusqu'alors inconnues . L'Institut britannique pour la sécurité de l'IA (AISI) a évalué Mythos de façon indépendante et confirmé ses capacités cybernétiques avancées
.
Anthropic a été explicite : les capacités cybernétiques offensives du modèle n'ont pas été délibérément entraînées. Elles ont « émergé comme une conséquence indirecte des améliorations générales en matière de code, de raisonnement et d'autonomie » . Les mêmes améliorations qui rendent le modèle plus efficace pour corriger des vulnérabilités le rendent aussi plus efficace pour les exploiter. Cela a des implications énormes en matière de gouvernance : si la capacité offensive est une propriété émergente de la puissance de raisonnement générale, les futurs modèles, encore plus capables, pourraient être impossibles à sécuriser sans limiter fondamentalement leur intelligence
.
Lorsqu'Anthropic a lancé Claude Mythos Preview en avril 2026, l'entreprise a fait ce qu'aucun grand laboratoire d'IA n'avait fait auparavant : annoncer son modèle le plus puissant tout en déclarant simultanément que le public ne pourrait pas l'utiliser .
L'entreprise a créé le Projet Glasswing, un programme d'accès restreint qui limite Mythos Preview à environ 50 organisations soigneusement sélectionnées. Parmi elles figurent des géants de la technologie tels qu'Apple, Amazon Web Services, Microsoft, Google, Cisco, CrowdStrike, Broadcom, Palo Alto Networks et Nvidia, ainsi que des opérateurs d'infrastructures critiques comme JPMorgan Chase. Des entités du gouvernement américain, dont la National Security Agency (NSA, l'Agence de sécurité nationale), ont également obtenu l'accès . L'objectif est de renforcer d'abord les logiciels les plus critiques au monde, donnant ainsi une longueur d'avance aux défenseurs avant que des IA offensives similaires — ou plus performantes — ne prolifèrent inévitablement
.
Le raisonnement d'Anthropic est simple : le modèle est tout simplement trop dangereux pour une diffusion à grande échelle. L'entreprise a reconnu que Mythos est « actuellement bien en avance sur tout autre modèle d'IA en matière de capacités cyber » et qu'il « présage une vague à venir de modèles capables d'exploiter des vulnérabilités d'une manière qui dépasse de loin les efforts des défenseurs » . Entre de mauvaises mains, il pourrait orchestrer des cyberattaques coordonnées contre des réseaux électriques, des hôpitaux et des systèmes financiers
.
La situation s'est envenimée lorsqu'Anthropic a proposé d'élargir l'accès d'environ 50 à 120 organisations. La Maison-Blanche a bloqué cette expansion — la première instance connue où le gouvernement américain restreint le déploiement commercial d'un modèle d'IA sur la base de considérations politiques, plutôt qu'en vertu d'une loi ou d'une réglementation spécifique . Les responsables ont invoqué la crainte que le modèle ne tombe entre des mains adverses et des doutes quant à la capacité d'Anthropic à fournir suffisamment de puissance de calcul pour servir un ensemble élargi d'utilisateurs sans dégrader le service pour les partenaires fédéraux critiques
.
Parallèlement, le Pentagone a annoncé des partenariats d'IA sur des réseaux classifiés avec huit entreprises — OpenAI, Google, Microsoft, AWS, Nvidia, SpaceX, Oracle et xAI — et a ostensiblement exclu Anthropic de la liste, signalant des tensions croissantes entre l'entreprise et l'establishment de la défense américaine .
Pour l'instant, Mythos reste sous clé. Les trois méga-banques japonaises y ont eu accès en mai 2026, faisant du Japon l'un des premiers pays en dehors des États-Unis à utiliser le modèle à des fins défensives .
L'arrivée de Claude Mythos a déclenché un débat philosophique urgent dans le monde de la cybersécurité. Les chercheurs de failles humains ont-ils un avenir viable, ou assistons-nous au commencement de la fin ?
1. L'IA augmente, elle ne remplace pas — du moins, pas encore. Palmiotti elle-même utilise Claude Code pour accroître son efficacité tout en s'appuyant sur la compétence humaine pour le contexte et le raisonnement créatif. De nombreux chercheurs soutiennent que l'expertise humaine reste indispensable pour la stratégie de haut niveau, la compréhension de la finalité et de la logique métier d'un système, et les chaînes d'attaque créatives que les modèles ne peuvent pas encore répliquer .
2. Les contrôles d'accès préservent les rôles humains — pour l'instant. Mythos est verrouillé pour environ 50 organisations. L'écrasante majorité des programmes de bug bounty, des tests d'intrusion et des évaluations de vulnérabilités est encore réalisée par des chercheurs humains utilisant des outils bien moins performants. Si cela change la frontière du possible, cela ne dissout pas l'immense secteur existant .
3. Nouveaux domaines et jugement. Les humains conservent un avantage pour détecter les failles de logique métier, mener des évaluations nuancées d'ingénierie sociale et fournir un jugement contextuel basé sur le risque que les modèles d'IA actuels peuvent négliger ou mal interpréter. Une IA peut trouver un dépassement de tampon techniquement exploitable ; un chercheur humain peut vous dire si ce dépassement a une réelle importance dans le contexte métier .
1. La vitesse et l'échelle brutes sont hors de portée humaine. Mythos peut ingérer des bases de code entières, trouver des vulnérabilités et écrire des exploits en quelques minutes — un travail qui pourrait occuper une équipe humaine qualifiée pendant des semaines ou des mois. Une publication l'a décrit comme « une IA capable de pénétrer presque n'importe quel ordinateur sur Terre » .
2. Les concours d'élite deviennent des vitrines pour l'IA. La prédiction de Palmiotti selon laquelle les compétitions de hacking comme Pwn2Own pourraient devenir obsolètes n'est pas un simple pressentiment — c'est une observation structurelle. Si un seul modèle peut trouver et chaîner des vulnérabilités qui exigeraient autrement plusieurs équipes d'élite, l'économie de la chasse aux vulnérabilités bascule fondamentalement .
3. Avantages de coût et d'efficacité écrasants. Un seul système d'IA peut scanner des millions de lignes de code, relier de petites vulnérabilités en chaînes d'exploit critiques, et opérer à une échelle qu'aucun humain ne peut soutenir. Cela change fondamentalement ce qui est possible en matière de découverte de vulnérabilités — non pas parce que les humains sont inefficaces, mais parce qu'ils ne peuvent pas rivaliser sur le volume .
Il est peu probable que ce débat se règle de manière binaire. Le futur immédiat va plus probablement se scinder en deux : un cercle restreint de défenseurs augmentés par l'IA, utilisant des outils comme Mythos sous un accès strictement contrôlé par les gouvernements et les entreprises, et un vaste cercle extérieur où l'essentiel du travail de sécurité reste obstinément, humainement manuel. La distance entre ces deux cercles se réduit à vue d'œil.
Comments
0 comments