标签: AI 安全
所有带有「AI 安全」标签的文章。
-
AI 安全灰天鹅:Agent 时代的提示注入与身份边界
Agent 安全不是给模型加一句更严厉的系统提示,而是重构整条执行链:区分可信与不可信上下文,训练专门的策略与红队模型,拦截工具调用,并重新设计 agent-native identity。
所有带有「AI 安全」标签的文章。
Agent 安全不是给模型加一句更严厉的系统提示,而是重构整条执行链:区分可信与不可信上下文,训练专门的策略与红队模型,拦截工具调用,并重新设计 agent-native identity。