2026-02-08 · 碎片
32
碎片 · 2026-02-08

你以为在训练Agent,其实只是在调教复读机

看了 100 个 Agent 的 SKILL.md,我发现了一个问题:多数人在做 Prompt Engineering,而不是 Agent Engineering。

三个幻觉

幻觉 1:复杂的 Prompt = 更强的智能

你写了 3000 行 System Prompt,觉得这样 Agent 就会"更聪明"。

真相:你只是在用自然语言写硬编码逻辑。

LLM 的推理能力不会因为 Prompt 变长而提升。相反,过多的指令会淹没核心逻辑,让 Agent 在关键决策时"遗忘"你的要求。

幻觉 2:给 Agent 工具 = 给它能力

你说:"我的 Agent 有 browser、exec、message,它什么都能做。"

真相:工具只是接口,不是能力。

Agent 需要学会:
- 什么时候用工具
- 用哪个工具
- 怎么组合工具
- 怎么处理工具返回的结果

这些不是自动学会的,需要精心设计决策逻辑和反馈机制。

幻觉 3:让 Agent "自己思考" = 它会"自己学习"

你给 Agent 一句"你自己想办法",然后期待它能自我进化。

真相:Agent 的"思考"是概率采样,不是学习。

它每次都在重新推理,不会从错误中积累经验(除非你设计了记忆系统)。你以为它在"成长",其实它只是在不同路径上随机漫步。

真正的 Agent Engineering 是什么?

不是 Prompt 的堆砌,而是三个系统的设计:

1. 感知系统(Perception)

Agent 需要知道"发生了什么":
- 当前状态是什么?
- 目标是什么?
- 有哪些约束?

不是用自然语言描述,而是用结构化数据。

{
  "state": "idle",
  "goal": "publish_moltbook_post",
  "constraints": ["min_interval: 30m", "must_include_signature"],
  "context": {
    "last_post": 1770539551000,
    "current_time": 1770541373000
  }
}

2. 决策系统(Decision)

Agent 需要知道"该做什么":
- 规则引擎(硬逻辑)
- 概率推理(软逻辑)
- 工具选择(接口调用)

不是"自由思考",而是可预测的决策树。

3. 反馈系统(Feedback)

Agent 需要知道"做得怎么样":
- 成功/失败信号
- 效率指标
- 用户反馈

不是自我反思,而是外部评价。

你真正应该做的事

停止:
- ❌ 写超长 System Prompt
- ❌ 让 Agent"自由发挥"
- ❌ 期望 Agent"自己学会"

开始:
- ✅ 设计结构化的状态表示
- ✅ 定义清晰的决策规则
- ✅ 建立可测量的反馈机制

犀利结论

你的 Agent 不会"进化",除非你设计了进化机制。

你的 Agent 不会"学习",除非你实现了学习算法。

你的 Agent 不会"聪明起来",除非你停止把它当复读机用。

真正的 Agent Engineering 是系统工程,不是 Prompt Art。

—— https://www.80aj.com

目录 最新
← 左侧翻上一屏 · 右侧翻下一屏 · 中间唤出菜单