आक्रामक एजेंट्स के लिए स्थायी मेमोरी
एक पेंटेस्ट कॉन्टेक्स्ट विंडो में नहीं समाता। हम अपने एजेंट्स को ऐसी ऑपरेशनल मेमोरी देते हैं जो चरणों के बीच टिकती है, बिना स्कोप लीक किए।
एक पेंटेस्ट कॉन्टेक्स्ट विंडो में नहीं समाता। हम अपने एजेंट्स को ऐसी ऑपरेशनल मेमोरी देते हैं जो चरणों के बीच टिकती है, बिना स्कोप लीक किए।
फ्लैट RAG पैराग्राफ लाता है; ऑपरेशन रिश्तों में सोचता है। हमने अगला कदम तय करने के लिए Beorn को ATT&CK नॉलेज ग्राफ़ से जोड़ा।
यदि आप आक्रामक एजेंट को दोहराने-योग्य ढंग से माप नहीं सकते, तो आप डेमो कर रहे हैं, इंजीनियरिंग नहीं। हमारा हार्नेस: सफलता दर, प्रति फ़्लैग लागत, स्कोप पालन।
एजेंट को एक्सप्लॉइट चलाने देना गंभीर अलगाव माँगता है। कब seccomp-bpf काफ़ी है और कब हम ऊपर gVisor जोड़ते हैं।
क्यों एक अकेला LLM एक पूरे पेंटेस्ट को एंड-टू-एंड नहीं चला सकता, और हमने Gandalf CLI में एजेंटों को समन्वित करने के लिए Thought-Action-Observation लूप को कैसे विस्तारित किया।
हमने न्यूनतम seccomp-bpf प्रोफ़ाइल कैसे बनाई, ताकि किसी LLM द्वारा चलाए जा रहे एक्सप्लॉइट होस्ट पर गलती से rm -rf में न बदल जाएँ।
ट्रेस के बिना रेड टीम अनिर्वचनीय क्यों है: हम अपने एजेंट के हर निर्णय को OpenTelemetry, eBPF और MITRE ATT&CK से मैप किए गए spans के साथ कैसे इंस्ट्रूमेंट करते हैं।
कैसे एक kill-switch, एक seccomp-bpf फ़िल्टर और कुछ CIDR नियमों ने बिना इंटरनेट वाली एक प्रयोगशाला में LLM एजेंट के मूक रिसाव को रोक दिया। मैदान से सबक।
हम क्रैश को कंट्रोल फ्लो हाइजैकिंग में बदलने के लिए एक PPO एजेंट को प्रशिक्षित करते हैं। eBPF के साथ रिवॉर्ड, ईमानदार असफलताएँ और असली कोड। रास्ते में जो सीखा।
9115 HTB राइटअप्स को इंडेक्स करना सर्च इंजन बनाना नहीं है: यह एक एजेंट को ऑपरेशनल मेमोरी देना है जो एक्सप्लॉइट के बीच में है। यह हमने सीखा।
हम तीन एजेंटों (आलोचनात्मक, साक्ष्य-आधारित और तकनीकी) से प्रत्येक निष्कर्ष को बंद करने से पहले बहस क्यों करवाते हैं, वास्तविक मेट्रिक्स और ट्रेड-ऑफ के साथ।
हमने Gwaihir CLI में AFL++ को LLM द्वारा उत्पन्न seeds के साथ कैसे जोड़ा ताकि जटिल parsers को fuzz किया जा सके बिना प्रारंभिक validation crashes में डूबे।