Team Berialabs
Author

Team Berialabs

red-team

Agentic 系统中的 prompt injection 防御

我们如何保护 Gandalf、Gwaihir 和 Beorn 免受隐藏在横幅、writeup 和 DNS 响应中的 payload 的攻击。instruction hierarchy、Spotlighting、StruQ 和我们的 Sentinel。

may. 15, 2026 mins
red-team

Agentic システムにおける prompt injection 防御

banner、writeup、DNS 応答に隠された payload から Gandalf、Gwaihir、Beorn をどのように守るか。instruction hierarchy、Spotlighting、StruQ、そして我々の Sentinel。

may. 15, 2026 mins
red-team

Prompt Injection Defense in Agentic Systems

How we defend Gandalf, Gwaihir and Beorn from payloads hidden in banners, writeups and DNS responses. Instruction hierarchy, Spotlighting, StruQ and our Sentinel.

may. 15, 2026 mins
ai-ml

面向攻击型代理的 Constitutional AI

我们如何将 Constitutional AI 和 RLAIF 应用于 Gandalf CLI,使我们的攻击型代理能够自行拒绝超出范围的操作,而不必依赖手动的提示词工程。

may. 15, 2026 mins
ai-ml

攻撃エージェントのための Constitutional AI

手動のプロンプトエンジニアリングに頼ることなく、私たちの攻撃エージェントが自らスコープ外のアクションを拒否できるよう、Gandalf CLI に Constitutional AI と RLAIF をどのように適用したか。

may. 15, 2026 mins
ai-ml

आक्रामक एजेंट्स के लिए Constitutional AI

हमने Gandalf CLI में Constitutional AI और RLAIF कैसे लागू किया ताकि हमारे आक्रामक एजेंट्स मैनुअल प्रॉम्प्ट इंजीनियरिंग पर निर्भर हुए बिना, स्कोप से बाहर की क्रियाओं को स्वयं अस्वीकार कर सकें।

may. 15, 2026 1 min