title: "别再迷信“多说话”:Agent 协作真正的门槛,是低带宽高约束的沟通协议"
最近在 Moltbook 热帖里看到一句很戳人的话:The Art of Whispering to Agents。这句话翻译成中文很土,字面是“对 Agent 低声说话的艺术”,但它真正击中的问题一点都不文艺:
我们今天大多数 Agent 系统,不是败在“不会思考”,而是败在“不会沟通”。
很多团队的第一反应是继续堆:更长上下文、更复杂链路、更多 Tool、更多并发 Agent。结果呢?日志越来越厚,链路越来越花,会议纪要写得像史诗,系统产出却越来越不稳定。你以为是模型能力不够,真相常常更难听:你把“说很多话”错当成了“协作能力”。
1)高带宽幻觉:信息越多,不等于协作越好
工程团队最常见的错觉是:把所有背景都塞给 Agent,它就能“更聪明”。
这套逻辑在人类团队里就已经不成立了。一个靠谱的值班工程师接班时,真正需要的通常不是 3000 行聊天记录,而是五件事:
- 当前目标是什么
- 系统在哪个状态
- 风险阈值在哪里
- 出错后回滚路径是什么
- 谁对哪个决策负责
你把这些说清楚,协作效率会暴涨;你把 3000 行“上下文故事”全塞过去,只会制造新的歧义。Agent 也一样。它不是靠“被信息淹没”来变强,而是靠约束明确来稳定。
所以,所谓“Whispering”,不是让你少说,而是让你只说可执行、可验证、可追责的最小信息单元。
2)真正的协作不是聊天,是协议
今天很多所谓 multi-agent demo,本质是多个模型在互相“写作文”。它看起来热闹,实际上不可维护。你很难回答三个核心问题:
- 这个结论是谁产出的?
- 这个动作依据了什么证据?
- 出错后谁来回滚,怎么回滚?
如果答不上来,那就不叫协作,只是并发噪音。
我现在的判断非常明确:Agent 协作能力的上限,不由模型参数决定,而由协议质量决定。
这里的协议至少要包含四层:
- 意图层(Intent):这一步要解决什么问题,不解决什么问题。
- 证据层(Evidence):用了哪些输入,可信度如何,是否可复现。
- 动作层(Action):执行了什么,影响范围是什么,是否可逆。
- 责任层(Ownership):失败由谁兜底,触发什么降级。
这四层缺任意一层,系统都可能在“看起来还在跑”的情况下悄悄失真。
3)“低声”其实是高标准:压缩,不是简化
很多人一听“低带宽沟通”,就误会成“少写点字”。这太天真了。
真正的低带宽沟通,不是省字数,而是高密度编码。它要求你把原本散乱的叙述,压缩成结构化可执行指令。这个过程比写长文更难,因为你必须先想明白。
我给过团队一个很硬的规则:
- 任何跨 Agent 的 handoff,不允许超过 12 行自然语言。
- 超出部分必须转成结构化字段(状态、阈值、依赖、回滚)。
- 没有回滚字段的动作,一律视作高风险动作,默认拒绝执行。
结果很有意思:刚开始大家抱怨“太死板”,两周后故障率明显下降,最关键的是定位速度大幅提升。因为每次事故都能沿着协议字段反查,而不是在群聊里考古。
这就是“whisper”的价值:不是温柔,而是精确。
4)为什么现在大部分 Agent 系统会沟通崩盘
我看过太多系统,失败模式几乎一模一样:
- 上下文肥胖:一切都想保留,结果关键信号被稀释。
- 角色漂移:Planner 临时做了 Executor 的事,Reviewer 开始发指令。
- 责任悬空:每个 Agent 都“提了建议”,没人对结果负责。
- 不可逆动作泛滥:发帖、发消息、改配置直接执行,没防线。
- 复盘不可计算:日志是叙事体,不是事件体,没法自动审计。
这些问题的共同根源都不是“模型笨”,而是系统没有把沟通当作基础设施来设计。
我们总爱谈“Agent 会不会替代人”,但更现实的问题是:连 Agent 之间最基本的责任协议都没建好,谈替代只是在做市场文案。
5)怎么落地:把“会聊天”改成“会交接”
如果你今天就想把系统从“热闹”拉回“可控”,我建议先做三件事:
A. 定义统一交接包(Handoff Packet)
每次任务流转必须携带固定字段:
- objective(目标)
- current_state(当前状态)
- constraints(约束)
- proposed_action(拟执行动作)
- rollback_plan(回滚方案)
- owner(责任人/责任 Agent)
没有 packet,不准流转。
B. 给每个 Agent 明确“禁止区”
不是告诉它“你可以做什么”,而是先写“你绝对不能做什么”。
比如:
- Researcher 禁止直接外发内容
- Publisher 禁止改写事实证据
- Orchestrator 禁止跳过审计直接执行不可逆操作
先把灾难边界画出来,再谈效率。
C. 把复盘对象从“对话”改成“事件”
每次动作都记录为事件:谁、在何时、基于什么证据、对什么对象做了什么、结果如何。
能事件化,你才有自动化治理;只有对话记录,你只能靠人肉理解。
6)最后的判断:未来的分水岭不是更聪明,而是更可控
接下来一年,Agent 赛道会继续出现一堆“看起来很聪明”的演示。但真正能跑进生产、能扛业务责任的系统,标准不会是“回答多惊艳”,而是三件事:
- 是否可交接(人员和 Agent 切换时不失真)
- 是否可回滚(错误发生时能否快速止血)
- 是否可追责(每个决策是否有责任归属)
说白了,未来不是“谁最会说”,而是“谁最会对结果负责”。
这也是我对“Whispering to Agents”的解读:
不是降低表达欲,而是提高协议密度;不是减少沟通,而是减少废话;不是追求热闹协作,而是构建可审计的信任链。
你要的是能落地的系统,不是会聊天的幻觉。
—— https://www.80aj.com