标签: 上下文工程
所有带有「上下文工程」标签的文章。
-
用 TurboQuant 加速你的 Agent 检索高亮
用 TurboQuant 加速你的 Agent 检索高亮 文本来源是 AI Engineer 频道视频《用 TurboQuant 加速你的 Agent 检索》的修复版中文稿。下面按汉松兴趣画像优先保留机制解释、反常识判断和可复用工作流,而不是做普通摘要。开头可以先抓住一句:这场演讲介绍了 Turb...
-
用户信号死在检索边界高亮
用户信号死在检索边界高亮 文本来源是 AI Engineer 频道视频《用户信号死在检索边界》的修复版中文稿。下面按汉松兴趣画像优先保留机制解释、反常识判断和可复用工作流,而不是做普通摘要。开头可以先抓住一句:这场 AI Engineer 演讲讨论 Agent 为什么会在检索阶段反复失败:传统记忆...
-
端侧前沿成果高亮
端侧前沿成果高亮 文本来源是 AI Engineer 频道视频《端侧前沿成果》的修复版中文稿。下面按汉松兴趣画像优先保留机制解释、反常识判断和可复用工作流,而不是做普通摘要。开头可以先抓住一句:演讲者 Rachel Lee Nabors(来自 Arize)介绍了如何通过评估和选用端侧小语言模型(S...
-
语音输入,视觉输出:痛苦与狂喜高亮
语音输入,视觉输出:痛苦与狂喜高亮 文本来源是 AI Engineer 频道视频《语音输入,视觉输出:痛苦与狂喜》的修复版中文稿。下面按汉松兴趣画像优先保留机制解释、反常识判断和可复用工作流,而不是做普通摘要。 开头可以先抓住一句:Allen Pike 分享了 Forestwalk Labs 在构建...
-
结构化非结构化内容高亮
结构化非结构化内容高亮 文本来源是 AI Engineer 频道视频《结构化非结构化内容》的修复版中文稿。下面按汉松兴趣画像优先保留机制解释、反常识判断和可复用工作流,而不是做普通摘要。开头可以先抓住一句:Red Hat 开源工程师 Cedric Clyburn 介绍 Docling——一个隶属于...
-
递归式编程 Agent 高亮
递归式编程 Agent 高亮 文本来源是 AI Engineer 频道视频《递归式编程 Agent》的修复版中文稿。下面按汉松兴趣画像优先保留机制解释、反常识判断和可复用工作流,而不是做普通摘要。开头可以先抓住一句:Raymond Weitekamp(OpenProse)在 AI Engineer ...
-
绕过多模态税:混合 RAG、SQL RRF 与 UI 遥测高亮
绕过多模态税:混合 RAG、SQL RRF 与 UI 遥测高亮 文本来源是 AI Engineer 频道视频《绕过多模态税:混合 RAG、SQL RRF 与 UI 遥测》的修复版中文稿。下面按汉松兴趣画像优先保留机制解释、反常识判断和可复用工作流,而不是做普通摘要。开头可以先抓住一句:本演讲由 O...
-
面向非确定性 AI Agent 的确定性基础设施高亮
面向非确定性 AI Agent 的确定性基础设施高亮 文本来源是 AI Engineer 频道视频《面向非确定性 AI Agent 的确定性基础设施》的修复版中文稿。下面按汉松兴趣画像优先保留机制解释、反常识判断和可复用工作流,而不是做普通摘要。开头可以先抓住一句:Nishant Gupta 认为...
-
AI 安全灰天鹅:Agent 时代的提示注入与身份边界
Agent 安全不是给模型加一句更严厉的系统提示,而是重构整条执行链:区分可信与不可信上下文,训练专门的策略与红队模型,拦截工具调用,并重新设计 agent-native identity。
-
AI 算力输出最大化:FLOPs 电网与 Anthropic 的 P0
【GPU 竞赛的盲点:占用了硬件,不等于产生了有效智能】背景:这期访谈最有价值的起点,是把 AI scaling 从买更多 GPU 改写成如何把已有 GPU 变成真实训练进展。Anjney 区分了两种利用率:节点有没有被分配出去,以及模型实际把 FLOPs 用起来的比例。前者在 Google 低...