攻撃エージェントのための永続メモリ
ペンテストは一つのコンテキストウィンドウに収まらない。実際のキャンペーンは偵察・エクスプロイト・ポストエクスプロイトに何時間もまたがる。フェーズ1で見たことをフェーズ4で忘れる agent は、作業を繰り返し、発見を取りこぼし、判断を誤る。永続メモリこそが LLM をオペレーターに変える。
メモリは三種類
- エピソード記憶: 何を・いつ・どの出力で実行したかの不変ログ。
- 作業記憶: キャンペーンの生の状態 — ホスト、認証情報、ピボット経路、未解決の仮説。フェーズ間で要約。
- 意味記憶: 再利用可能な知識(TTP、ライトアップ)。Beorn が RAG で提供。
規律ある検索
典型的な失敗は毎回のプロンプトに全メモリを流し込むこと。関連性とフェーズで検索する。agent が「10.0.0.0/24 の有効な認証情報」を求めれば、出所付きでそれだけが返る。
memory.query({ scope: "10.0.0.0/24", kind: "credential",
phase: "lateral-movement", max_tokens: 800 })
スコープ付きメモリ、漏洩ではない
制御しなければメモリは流出面になる。すべての書き込みは Sentinel を通る。承認スコープ外は永続化されず、キルスイッチは作業記憶を即座に消去する。エピソード記憶は暗号化保持、作業記憶は設計上一時的。
私たちが提供するもの
Gandalf では永続メモリは第一級だ。各 agent は空のウィンドウではなく、前フェーズの再構築要約から始める。繰り返しを減らし、文脈に基づく判断と完全な軌跡を残す。