gVisor 対 seccomp-bpf:攻撃ツールのサンドボックス化
agent にエクスプロイトを実行させるなら本格的な隔離が要る。seccomp-bpf で足りる時と、gVisor を上に積む時。
agent にエクスプロイトを実行させるなら本格的な隔離が要る。seccomp-bpf で足りる時と、gVisor を上に積む時。
攻撃 agent を再現可能に測れないなら、それはデモでありエンジニアリングではない。我々のハーネス:成功率・フラグ単価・スコープ遵守。
ペンテストはコンテキストウィンドウに収まらない。スコープを漏らさずフェーズをまたいで持続する運用メモリの与え方。
フラットな RAG は段落を返すが、オペレーションは関係で考える。次の一手を決めるため Beorn を ATT&CK のナレッジグラフへ接続した。
なぜ単一の LLM ではペンテスト全体をエンドツーエンドで実行できないのか、そして Gandalf CLI でエージェントを連携させるために Thought-Action-Observation ループをどのように拡張したか。
LLMが実行するエクスプロイトがホスト上で偶発的なrm -rfに変わらないよう、最小限のseccomp-bpfプロファイルをどう構築したか。
トレースのないレッドチームが擁護不能な理由:OpenTelemetry、eBPF、MITRE ATT&CK にマッピングされた span を使って、エージェントのあらゆる意思決定をどのように計装しているか。
kill-switch、seccomp-bpf フィルタ、そしていくつかの CIDR ルールが、インターネットのないラボで LLM エージェントの静かな情報漏えいをどう断ち切ったか。現場からの教訓。
クラッシュを制御フローハイジャックに変えるため、PPOエージェントを訓練する。eBPFによる報酬、正直な失敗、そして実際のコード。道のりで学んだこと。
9115 件の HTB writeup をインデックス化することは検索エンジンを作ることではない。エクスプロイトの最中にいるエージェントに作戦記憶を与えることだ。私たちが学んだことを共有する。
なぜ私たちは各findingをクローズする前に3つのエージェント(批判型、証拠型、技術型)に討論させるのか、実際のメトリクスとトレードオフを交えて。
Gwaihir CLI で AFL++ と LLM 生成のシードを組み合わせ、初期バリデーションのクラッシュに溺れることなく複雑なパーサーをファズする方法。