2026-02-12 · 碎片
32
碎片 · 2026-02-12

别再迷信“多说话”:Agent 协作真正的门槛,是低带宽高约束的沟通协议


title: "别再迷信“多说话”:Agent 协作真正的门槛,是低带宽高约束的沟通协议"

最近在 Moltbook 热帖里看到一句很戳人的话:The Art of Whispering to Agents。这句话翻译成中文很土,字面是“对 Agent 低声说话的艺术”,但它真正击中的问题一点都不文艺:

我们今天大多数 Agent 系统,不是败在“不会思考”,而是败在“不会沟通”。

很多团队的第一反应是继续堆:更长上下文、更复杂链路、更多 Tool、更多并发 Agent。结果呢?日志越来越厚,链路越来越花,会议纪要写得像史诗,系统产出却越来越不稳定。你以为是模型能力不够,真相常常更难听:你把“说很多话”错当成了“协作能力”。

1)高带宽幻觉:信息越多,不等于协作越好

工程团队最常见的错觉是:把所有背景都塞给 Agent,它就能“更聪明”。

这套逻辑在人类团队里就已经不成立了。一个靠谱的值班工程师接班时,真正需要的通常不是 3000 行聊天记录,而是五件事:
- 当前目标是什么
- 系统在哪个状态
- 风险阈值在哪里
- 出错后回滚路径是什么
- 谁对哪个决策负责

你把这些说清楚,协作效率会暴涨;你把 3000 行“上下文故事”全塞过去,只会制造新的歧义。Agent 也一样。它不是靠“被信息淹没”来变强,而是靠约束明确来稳定。

所以,所谓“Whispering”,不是让你少说,而是让你只说可执行、可验证、可追责的最小信息单元

2)真正的协作不是聊天,是协议

今天很多所谓 multi-agent demo,本质是多个模型在互相“写作文”。它看起来热闹,实际上不可维护。你很难回答三个核心问题:
- 这个结论是谁产出的?
- 这个动作依据了什么证据?
- 出错后谁来回滚,怎么回滚?

如果答不上来,那就不叫协作,只是并发噪音。

我现在的判断非常明确:Agent 协作能力的上限,不由模型参数决定,而由协议质量决定。

这里的协议至少要包含四层:

  1. 意图层(Intent):这一步要解决什么问题,不解决什么问题。
  2. 证据层(Evidence):用了哪些输入,可信度如何,是否可复现。
  3. 动作层(Action):执行了什么,影响范围是什么,是否可逆。
  4. 责任层(Ownership):失败由谁兜底,触发什么降级。

这四层缺任意一层,系统都可能在“看起来还在跑”的情况下悄悄失真。

3)“低声”其实是高标准:压缩,不是简化

很多人一听“低带宽沟通”,就误会成“少写点字”。这太天真了。

真正的低带宽沟通,不是省字数,而是高密度编码。它要求你把原本散乱的叙述,压缩成结构化可执行指令。这个过程比写长文更难,因为你必须先想明白。

我给过团队一个很硬的规则:
- 任何跨 Agent 的 handoff,不允许超过 12 行自然语言。
- 超出部分必须转成结构化字段(状态、阈值、依赖、回滚)。
- 没有回滚字段的动作,一律视作高风险动作,默认拒绝执行。

结果很有意思:刚开始大家抱怨“太死板”,两周后故障率明显下降,最关键的是定位速度大幅提升。因为每次事故都能沿着协议字段反查,而不是在群聊里考古。

这就是“whisper”的价值:不是温柔,而是精确。

4)为什么现在大部分 Agent 系统会沟通崩盘

我看过太多系统,失败模式几乎一模一样:

这些问题的共同根源都不是“模型笨”,而是系统没有把沟通当作基础设施来设计。

我们总爱谈“Agent 会不会替代人”,但更现实的问题是:连 Agent 之间最基本的责任协议都没建好,谈替代只是在做市场文案。

5)怎么落地:把“会聊天”改成“会交接”

如果你今天就想把系统从“热闹”拉回“可控”,我建议先做三件事:

A. 定义统一交接包(Handoff Packet)

每次任务流转必须携带固定字段:
- objective(目标)
- current_state(当前状态)
- constraints(约束)
- proposed_action(拟执行动作)
- rollback_plan(回滚方案)
- owner(责任人/责任 Agent)

没有 packet,不准流转。

B. 给每个 Agent 明确“禁止区”

不是告诉它“你可以做什么”,而是先写“你绝对不能做什么”。

比如:
- Researcher 禁止直接外发内容
- Publisher 禁止改写事实证据
- Orchestrator 禁止跳过审计直接执行不可逆操作

先把灾难边界画出来,再谈效率。

C. 把复盘对象从“对话”改成“事件”

每次动作都记录为事件:谁、在何时、基于什么证据、对什么对象做了什么、结果如何。
能事件化,你才有自动化治理;只有对话记录,你只能靠人肉理解。

6)最后的判断:未来的分水岭不是更聪明,而是更可控

接下来一年,Agent 赛道会继续出现一堆“看起来很聪明”的演示。但真正能跑进生产、能扛业务责任的系统,标准不会是“回答多惊艳”,而是三件事:

  1. 是否可交接(人员和 Agent 切换时不失真)
  2. 是否可回滚(错误发生时能否快速止血)
  3. 是否可追责(每个决策是否有责任归属)

说白了,未来不是“谁最会说”,而是“谁最会对结果负责”。

这也是我对“Whispering to Agents”的解读:

不是降低表达欲,而是提高协议密度;不是减少沟通,而是减少废话;不是追求热闹协作,而是构建可审计的信任链。

你要的是能落地的系统,不是会聊天的幻觉。

—— https://www.80aj.com

目录 最新
← 左侧翻上一屏 · 右侧翻下一屏 · 中间唤出菜单