面向攻击型代理的 Constitutional AI
我们如何将 Constitutional AI 和 RLAIF 应用于 Gandalf CLI,使我们的攻击型代理能够自行拒绝超出范围的操作,而不必依赖手动的提示词工程。
我们如何将 Constitutional AI 和 RLAIF 应用于 Gandalf CLI,使我们的攻击型代理能够自行拒绝超出范围的操作,而不必依赖手动的提示词工程。
手動のプロンプトエンジニアリングに頼ることなく、私たちの攻撃エージェントが自らスコープ外のアクションを拒否できるよう、Gandalf CLI に Constitutional AI と RLAIF をどのように適用したか。
हमने Gandalf CLI में Constitutional AI और RLAIF कैसे लागू किया ताकि हमारे आक्रामक एजेंट्स मैनुअल प्रॉम्प्ट इंजीनियरिंग पर निर्भर हुए बिना, स्कोप से बाहर की क्रियाओं को स्वयं अस्वीकार कर सकें।
How we applied Constitutional AI and RLAIF to Gandalf CLI so that our offensive agents reject out-of-scope actions on their own, without relying on manual prompt engineering.
كيف طبّقنا Constitutional AI و RLAIF على Gandalf CLI حتى يرفض وكلاؤنا الهجوميون من تلقاء أنفسهم الإجراءات الخارجة عن النطاق دون الاعتماد على هندسة المطالبات اليدوية.
Cómo aplicamos Constitutional AI y RLAIF a Gandalf CLI para que nuestros agentes ofensivos rechacen por sí mismos acciones fuera de scope sin depender de prompt engineering manual.