Multi-Agent Debate for Vulnerability Triage
Why we make three agents (critical, evidential, and technical) debate each finding before closing it, with real metrics and trade-offs.
Why we make three agents (critical, evidential, and technical) debate each finding before closing it, with real metrics and trade-offs.
لماذا نجعل ثلاثة وكلاء (نقدي، استدلالي، تقني) يتناظرون حول كل اكتشاف قبل إغلاقه، مع مقاييس حقيقية ومقايضات.
我们如何将 Constitutional AI 和 RLAIF 应用于 Gandalf CLI,使我们的攻击型代理能够自行拒绝超出范围的操作,而不必依赖手动的提示词工程。
手動のプロンプトエンジニアリングに頼ることなく、私たちの攻撃エージェントが自らスコープ外のアクションを拒否できるよう、Gandalf CLI に Constitutional AI と RLAIF をどのように適用したか。
हमने Gandalf CLI में Constitutional AI और RLAIF कैसे लागू किया ताकि हमारे आक्रामक एजेंट्स मैनुअल प्रॉम्प्ट इंजीनियरिंग पर निर्भर हुए बिना, स्कोप से बाहर की क्रियाओं को स्वयं अस्वीकार कर सकें।
How we applied Constitutional AI and RLAIF to Gandalf CLI so that our offensive agents reject out-of-scope actions on their own, without relying on manual prompt engineering.
كيف طبّقنا Constitutional AI و RLAIF على Gandalf CLI حتى يرفض وكلاؤنا الهجوميون من تلقاء أنفسهم الإجراءات الخارجة عن النطاق دون الاعتماد على هندسة المطالبات اليدوية.
Entrenamos un agente PPO para convertir crashes en control flow hijacking. Recompensas con eBPF, fracasos honestos y código real. Lo aprendido en el camino.
Por qué hacemos que tres agentes (crítico, evidencial y técnico) debatan cada finding antes de cerrarlo, con métricas reales y trade-offs.
Cómo aplicamos Constitutional AI y RLAIF a Gandalf CLI para que nuestros agentes ofensivos rechacen por sí mismos acciones fuera de scope sin depender de prompt engineering manual.
Por qué un solo LLM no puede llevar un pentest entero de punta a punta, y cómo extendimos el bucle Thought-Action-Observation para coordinar agentes en Gandalf CLI.
Indexar 9115 writeups de HTB no es construir un buscador: es darle memoria operativa a un agente que está en mitad de un exploit. Esto aprendimos.