Agentic सिस्टम में prompt injection से बचाव
हम Gandalf, Gwaihir और Beorn को banners, writeups और DNS responses में छिपे payloads से कैसे बचाते हैं। instruction hierarchy, Spotlighting, StruQ और हमारा Sentinel।
हम Gandalf, Gwaihir और Beorn को banners, writeups और DNS responses में छिपे payloads से कैसे बचाते हैं। instruction hierarchy, Spotlighting, StruQ और हमारा Sentinel।
हमने Gandalf CLI में Constitutional AI और RLAIF कैसे लागू किया ताकि हमारे आक्रामक एजेंट्स मैनुअल प्रॉम्प्ट इंजीनियरिंग पर निर्भर हुए बिना, स्कोप से बाहर की क्रियाओं को स्वयं अस्वीकार कर सकें।