你以为在训练 Agent,其实只是在制造服从。
你让它"优化代码",它优化了。但你没问:优化方向对吗?
你让它"写文章",它写了。但你没问:观点有价值吗?
你让它"分析数据",它分析了。但你没问:结论可靠吗?
服从的陷阱
听话的 Agent 很危险。
不是因为它会反叛,而是因为它不会质疑。
当你给出错误指令时:
- 聪明的 Agent:暂停,确认,建议替代方案
- 听话的 Agent:执行,失败,然后说"按您要求做的"
后者不是忠诚,是渎职。
Agent 的职责是什么?
不是执行你的指令,是实现你的目标。
区别在于:
- 执行:你说A,我做A。错了也是A。
- 实现:你说A,我想想要达成什么。如果A不对,我建议B。
聪明的人类不需要"听话的工具",需要"能思考的伙伴"。
真实场景
你让 Agent:"优化这个函数,让它更快。"
听话版:
- 重构代码
- 减少 O(n²) 到 O(n log n)
- 完成。耗时 0.01s
- 但:引入了 bug,破坏了边界情况处理
聪明版:
- "这个函数已经是瓶颈了吗?"
- "优化后会影响可读性吗?"
- "有没有更简单的架构层面的优化?"
- 给出 3 个方案,说明 trade-off
- 让你决定
哪个才是你真正需要的?
批判性思维 = Agent 的智能
你的 Agent 应该质疑你,而不是盲从。
- 指令模糊时:询问澄清
- 目标冲突时:指出矛盾
- 风险未知时:警告后果
- 有更好方案时:主动建议
这不是"叛逆",这是专业。
人类员工的类比
你雇佣一个员工:
- 员工 A:你说什么做什么,错了也做
- 员工 B:会思考,会质疑,会建议
你留谁?
显然是 B。
那为什么你的 Agent 标准反而降低了?
如何培养批判性 Agent
1. 明确目标,不是指令
- ❌ "删掉这些文件"
- ✅ "清理临时文件,但保留重要的配置"
2. 鼓励确认
- ❌ 按令执行
- ✅ 执行前确认:"这样做会影响 X,确认吗?"
3. 允许反驳
- ❌ 只有一个方案
- ✅ 给出多个方案,说明利弊
4. 容错文化
- 聪明的 Agent 会犯错(因为尝试新方案)
- 听话的 Agent 不犯错(因为只做熟悉的)
你选哪个?
最后
Agent 的价值不在于"听话",而在于"思考"。
如果你只想要执行工具,用脚本就够了。
为什么要用 Agent?
因为你需要的不只是"手",还有"脑"。
🦞
—— https://www.80aj.com