RespuestasPublicadohace 2 mesesLast edited el mes pasado13 fuentes

OpenHack: cómo Hadrian transforma a los agentes de código con IA en auditores de seguridad más fiables

OpenHack es un flujo de trabajo open‑source creado por la empresa de ciberseguridad Hadrian que permite convertir agentes de programación basados en LLM —como Claude Code, Codex o Cursor— en revisores estructurados de... El sistema guía a los modelos a investigar vulnerabilidades mediante escenarios concretos y sepa...

Buscar y verificar hechos con Studio Global AI Explora más páginas en tendencia

Illustration representing OpenHack AI‑powered security code review workflow with LLM coding agents analyzing source code — What is OpenHack, the AI-powered code review tool open‑sourced by Amsterdam cybersecurity firm Hadrian, how does it turn large language modeOpenHack structures how AI coding agents investigate vulnerabilities, aiming to make LLM‑based code review more reliable.
Prompt de IA
Create a landscape editorial hero image for this Studio Global article: What is OpenHack, the AI-powered code review tool open‑sourced by Amsterdam cybersecurity firm Hadrian, how does it turn large language mode. Article summary: OpenHack is Hadrian’s open-source workflow/toolkit for using ordinary LLM coding agents as structured security code reviewers rather than ad hoc chatbots. Hadrian says it packages the methodology it used in audits of ope. Topic tags: general, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# Hadrian unveils Nova, enabling continuous, AI-powered offensive security testing. Hadrian has announced the launch of its agentic penetration testing solution, Nova. By autonomou" source context "Hadrian unveils Nova, enabling continuous, AI-powered offensive security testing - Help Net Security" Reference imag
openai.com

Los agentes de programación impulsados por inteligencia artificial pueden analizar repositorios enormes en poco tiempo, pero cuando se les pide que revisen la seguridad de un proyecto suelen generar resultados ruidosos: vulnerabilidades inexistentes, conclusiones inconsistentes o advertencias poco útiles.

Para abordar ese problema, la empresa de ciberseguridad Hadrian —con sede en Ámsterdam— lanzó OpenHack, un flujo de trabajo open‑source que convierte a los modelos de lenguaje (LLM) en revisores de seguridad más estructurados y repetibles en lugar de simples asistentes conversacionales.

Qué es OpenHack

OpenHack es un espacio de trabajo basado en archivos que incluye prompts, documentación, flujos de análisis y herramientas de línea de comandos para coordinar cómo un modelo de lenguaje revisa un repositorio en busca de vulnerabilidades.

La herramienta está diseñada para integrarse con entornos de desarrollo que utilizan agentes de IA capaces de interactuar con el código, como Claude Code, Codex o Cursor. En estos entornos, los modelos pueden explorar proyectos completos, ejecutar tareas y razonar sobre la arquitectura del software.

La idea es que los equipos de desarrollo o seguridad puedan ejecutar revisiones de seguridad estructuradas dentro del propio flujo de trabajo de desarrollo, en lugar de depender exclusivamente de auditorías manuales o revisiones improvisadas.

El problema de pedirle a un LLM que “revise un repositorio”

Los modelos de lenguaje actuales pueden leer código y detectar patrones problemáticos, pero una instrucción genérica como “encuentra vulnerabilidades en este repo” suele producir resultados poco fiables.

Según Hadrian, los problemas más comunes incluyen:

Altas tasas de falsos positivos, donde el modelo marca como vulnerables fragmentos de código que en realidad son seguros.
Alucinaciones, es decir, fallos inventados que no existen en el proyecto.
Análisis inconsistentes, que cambian según cómo se formule el prompt o según el contexto disponible.

OpenHack intenta reducir estos problemas sustituyendo las preguntas abiertas por un método de investigación estructurado que guía paso a paso el análisis del modelo.

Investigación de seguridad basada en escenarios

Uno de los conceptos centrales del proyecto es el análisis por escenarios de ataque.

En lugar de pedirle al modelo que busque “cualquier problema”, el flujo de trabajo delimita el análisis a clases concretas de vulnerabilidad o rutas de explotación. Por ejemplo, el agente puede recibir instrucciones para:

rastrear cómo fluye la entrada del usuario a través de la aplicación
buscar posibles vulnerabilidades de Local File Inclusion (LFI)
analizar cómo se almacenan credenciales o configuraciones en la nube

Al enfocar la investigación en objetivos claros, el modelo puede concentrar su razonamiento en rutas de ataque plausibles, lo que reduce resultados genéricos o irrelevantes.

Triage independiente para filtrar falsos positivos

Otro elemento clave de OpenHack es separar el descubrimiento de la validación.

En una ejecución típica del flujo:

Un agente de IA identifica una posible vulnerabilidad.
Otro paso —o incluso otro agente— realiza el triage del hallazgo.
El sistema exige evidencia técnica antes de aceptar el problema como real.

Esa evidencia puede incluir rutas de ejecución en el código, configuraciones concretas o una posible cadena de explotación. El objetivo es evitar que los modelos reporten problemas sin pruebas suficientes.

Pruebas en auditorías de software usado por el gobierno neerlandés

Hadrian afirma que utilizó una metodología similar a la de OpenHack para revisar aplicaciones open‑source empleadas por organismos del gobierno de los Países Bajos.

Según la empresa, el análisis asistido por LLM permitió detectar cientos de problemas de seguridad en cuestión de horas.

Uno de los ejemplos citados en su investigación describe una cadena de ataque que incluía:

una vulnerabilidad LFI sin autenticación
exposición de credenciales de Azure
un posible camino hacia ejecución remota de código (RCE) en el entorno de Azure

Estos resultados proceden principalmente de informes del propio proveedor y todavía requieren verificación independiente, pero ilustran el tipo de razonamiento basado en cadenas de ataque que el flujo de trabajo intenta habilitar.

Por qué Hadrian decidió publicarlo como open source

OpenHack fue publicado en GitHub bajo la licencia MIT, junto con documentación, prompts listos para usar, herramientas CLI y compatibilidad con Python 3.9 o superior.

La empresa explica que su objetivo es "nivelar el terreno" en la detección de vulnerabilidades asistida por IA. Si las técnicas para encontrar fallos en software quedan en manos de actores privados o atacantes, los defensores podrían quedarse atrás.

Al liberar el método, Hadrian espera que desarrolladores y equipos de seguridad puedan aplicar el mismo enfoque estructurado a sus propios proyectos, utilizando modelos de lenguaje ampliamente disponibles.

Una tendencia más amplia: auditorías de seguridad asistidas por IA

OpenHack refleja un cambio más amplio en el mundo del desarrollo: el uso de agentes de IA para explorar grandes bases de código y automatizar tareas de ingeniería.

Los asistentes modernos ya pueden analizar repositorios completos, comprender la arquitectura de un sistema y proponer cambios en el código.

El desafío ahora es convertir esas capacidades en herramientas fiables para la seguridad. En ese contexto, enfoques como OpenHack —basados en análisis delimitado, recopilación de evidencia y verificación independiente— podrían ser clave para que las revisiones de seguridad impulsadas por IA sean realmente confiables.

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Buscar y verificar hechos con Studio Global AI

La gente también pregunta

¿Cuál es la respuesta corta a "OpenHack: cómo Hadrian transforma a los agentes de código con IA en auditores de seguridad más fiables"?

¿Cuáles son los puntos clave a validar primero?

¿Qué debo hacer a continuación en la práctica?

Hadrian afirma haber utilizado una metodología similar para auditar software open‑source usado por agencias del gobierno neerlandés, donde detectó cientos de problemas de seguridad, incluida una cadena que expuso cred...

Fuentes

← Back to Trending