Tag

lang-zh

ai-ml

渗透测试代理的评测与基准

若无法可重复地度量攻击型代理,你做的是演示而非工程。我们的评测框架:成功率、每 flag 成本与范围遵守。

may. 29, 2026 1 min
ai-ml

面向攻击型代理的持久记忆

渗透测试装不进一个上下文窗口。我们如何为代理提供跨阶段持续、且不泄露范围的操作记忆。

may. 29, 2026 1 min
rag

图谱 RAG 与 MITRE ATT&CK

扁平 RAG 检索段落;而行动以关系思考。我们把 Beorn 接到 ATT&CK 知识图谱,以决定下一步。

may. 29, 2026 1 min
ai-ml

用于杀伤链编排的 ReAct 提示

为什么单个 LLM 无法端到端地运行整个渗透测试,以及我们如何扩展 Thought-Action-Observation 循环以在 Gandalf CLI 中协调代理。

may. 15, 2026 mins
engineering

面向自主代理的 Seccomp-bpf

我们如何构建最小化的 seccomp-bpf 配置,让 LLM 执行的漏洞利用不会变成主机上意外的 rm -rf。

may. 15, 2026 mins
engineering

进攻性行动中的可观测性

为什么没有追踪的红队是站不住脚的:我们如何用 OpenTelemetry、eBPF 以及映射到 MITRE ATT&CK 的 span 来检测代理的每一个决策。

may. 15, 2026 mins
red-team

气隙环境中的安全工具调用

一个 kill-switch、一个 seccomp-bpf 过滤器和几条 CIDR 规则,如何切断了无网络实验室中 LLM 代理的无声泄漏。来自一线的经验。

may. 15, 2026 mins
ai-ml

用于漏洞生成的强化学习

我们训练一个 PPO 智能体将崩溃转化为控制流劫持。使用 eBPF 的奖励、坦诚的失败和真实的代码。一路走来所学到的东西。

may. 15, 2026 mins
ai-ml

战术 RAG:从 Writeup 到行动

索引 9115 篇 HTB writeup 并不是构建搜索引擎,而是为一个正在进行渗透的智能体提供操作记忆。以下是我们学到的经验。

may. 15, 2026 mins
ai-ml

用于漏洞分诊的多智能体辩论

为什么我们让三个智能体(批判型、证据型和技术型)在关闭每个发现之前对其进行辩论,包含真实指标和权衡。

may. 15, 2026 mins