标签： AI 安全

所有带有「AI 安全」标签的文章。

AI 安全灰天鹅：Agent 时代的提示注入与身份边界

2026年6月23日
AI Highlight

Agent 安全不是给模型加一句更严厉的系统提示，而是重构整条执行链：区分可信与不可信上下文，训练专门的策略与红队模型，拦截工具调用，并重新设计 agent-native identity。