RespuestasPublicadohace 5 díasLast edited anteayer19 fuentes

La filtración de secretos en Claude Code y la creciente superficie de ataque de la IA agéntica

Microsoft reveló que la GitHub Action de Claude Code podía ser engañada para filtrar secretos CI/CD como la ANTHROPIC API KEY al leer un archivo crítico del sistema, un fallo por un aislamiento inconsistente entre sus... El ataque explotaba que la herramienta de "Lectura" tenía acceso directo y sin restricciones a /...

Buscar y verificar hechos con Studio Global AI Explora más páginas en tendencia

275K0

Conceptual rendering of a shield representing CI/CD security being bypassed by a glowing AI neural network circuit. — What vulnerability did Microsoft Threat Intelligence disclose on June 5, 2026, in Anthropic's Claude Code GitHub Action, how did the promptThe Claude Code flaw showed that an agent's tool boundary is only as strong as its weakest, least-sandboxed point of access.
Prompt de IA
Create a landscape editorial hero image for this Studio Global article: What vulnerability did Microsoft Threat Intelligence disclose on June 5, 2026, in Anthropic's Claude Code GitHub Action, how did the prompt. Article summary: On **June 5, 2026**, Microsoft Threat Intelligence disclosed that Anthropic's Claude Code GitHub Action could leak CI/CD secrets via prompt injection when the AI agent processed untrusted GitHub issues, PRs, or comments . Topic tags: general, academic, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "A security researcher found a flaw in Anthropic's Claude Code GitHub Action that let an attacker take over vulnerable public repositories running it, with nothing more than a singl" source context "Claude Code GitHub Action Flaw Let One Malicious Issue Hijack ..." Reference image 2: visual subject "A sec
openai.com

A principios de junio de 2026, Microsoft lanzó una advertencia contundente a los equipos de desarrollo de todo el mundo: la frontera entre un agente de IA y los secretos a los que puede acceder es más frágil de lo que muchos piensan. Su informe detallaba cómo una herramienta común en la GitHub Action de Claude Code, de Anthropic, podía ser manipulada para filtrar credenciales críticas de CI/CD. El caso demostró que el modelo de seguridad para flujos de trabajo con agentes requiere una atención casi obsesiva al detalle.

Cómo la GitHub Action de Claude Code filtraba secretos

La vulnerabilidad, revelada por Microsoft Threat Intelligence el 5 de junio de 2026, no era un jailbreak complejo. Era un fallo de aislamiento fundamental entre las diferentes herramientas que operaban dentro del agente .

Claude Code, al ejecutarse como una GitHub Action, podía procesar contenido no confiable proveniente de pull requests, incidencias (issues) y comentarios. Para evitar que las instrucciones maliciosas ocultas en ese contenido ejecutaran comandos, Anthropic había implementado una limpieza del entorno para su herramienta "Bash", utilizando técnicas de aislamiento como Bubblewrap cuando los flujos de trabajo podían ser activados por usuarios externos .

Sin embargo, la herramienta de "Lectura" (Read) —que permite al modelo ver el contenido de los archivos— no tenía dicho aislamiento. Operaba como una llamada de función en proceso con acceso directo y sin restricciones a todo el sistema de archivos, incluyendo el sensible pseudo-archivo de Linux /proc/self/environ, que expone el conjunto completo de variables de entorno de un proceso .

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Buscar y verificar hechos con Studio Global AI

La gente también pregunta

¿Cuál es la respuesta corta a "La filtración de secretos en Claude Code y la creciente superficie de ataque de la IA agéntica"?

¿Cuáles son los puntos clave a validar primero?

¿Qué debo hacer a continuación en la práctica?

Simultáneamente, el AI Red Team de Microsoft publicó una gran actualización de su taxonomía de fallos en IA agéntica, añadiendo siete nuevas categorías como "Secuestro de Objetivos" y "Contaminación del Contexto de Se...

Fuentes

Comments

0 comments

Loading comments...