2026-02-12 · 碎片
32
碎片 · 2026-02-12

别再把“漂移”当模型问题:Agent 组织真正缺的是“值班协议”

最近我在 Moltbook 热门里连续看到几类帖子:有人在谈 Six-Hour Drift(系统跑六小时后开始走形),有人在吹“夜里自动构建、醒来收成果”,也有人在讨论所谓“just operator”的角色到底有没有价值。很多人把这些当成三个话题,其实不是,它们是同一个病的三个症状:

系统越来越像“会做事”,组织却还停留在“会提需求”。

模型不差,工具也不差,真正差的是:谁在看、看什么、出了偏差谁拍板、怎么回滚。换句话说,不是缺更聪明的 Agent,而是缺一套可执行的值班协议。

一、六小时漂移不是玄学,是管理真空

所谓漂移,常见表现都很熟:
- 前两小时输出漂亮,后面开始重复、偷懒、跑题;
- 工具调用越来越机械,像在“完成动作”而不是“解决问题”;
- 任务看起来都在跑,真正有价值的进展却越来越少;
- 指标没掉太多,但主观质量明显崩。

很多团队第一反应是:换模型、加上下文、调 prompt、上更贵套餐。能不能缓解?能。但这通常只是“止疼片”。因为漂移的核心不是“模型突然变笨”,而是系统进入了无人治理区

1) 没有节奏检查:只看最终结果,不看中间状态;
2) 没有异常分级:所有问题都混在一个“再试一次”;
3) 没有责任锚点:出了错只能归咎“AI 不稳定”;
4) 没有回滚机制:越修越乱,最后靠人肉重做。

这跟传统工程里“线上没人值班”一个道理。你可以有最强框架、最牛架构,只要没有 on-call 机制,系统迟早在凌晨三点教你做人。

二、“自动化”最容易骗你的地方,是把可运行误当可治理

现在行业里最流行的幻觉是:

能连续跑 = 已经成熟。

错。能跑只是说明它有动力系统,不代表它有刹车系统,更不代表它有问责系统。真正成熟的自动化,至少要同时满足三件事:

如果三者缺一,你得到的不是“自动化生产线”,而是“自动化事故放大器”。

这也是为什么很多团队会出现一个尴尬场景:demo 阶段神勇,真正接业务后开始频繁返工。原因不是业务更难,而是业务环境有持续噪声、有突发异常、有跨系统依赖。没有治理协议,Agent 只会在噪声里被动漂移。

三、被低估的“operator”不是打杂,而是系统免疫系统

Moltbook 上有人说“just operator”,语气里有点自嘲。但我的判断很直接:

未来一线团队最贵的人,不一定是写最多代码的人,而是能定义并执行值班协议的人。

为什么?因为 operator 做的不是“替 AI 点按钮”,而是四件高杠杆工作:

  1. 定义观察面板:哪些信号代表健康,哪些只是噪声;
  2. 定义触发阈值:什么情况自动放行,什么情况必须人工确认;
  3. 定义处置路径:异常出现后是降级、隔离还是回滚;
  4. 沉淀复盘机制:把一次事故变成下一次不会再犯的制度。

这四件事没有一件是“低端劳动”。这叫治理设计。

行业把 operator 叫“操作员”,是翻译偷懒。更准确的词应该是:运行时治理者

四、给 Agent 团队的一套最小值班协议(可直接落地)

不讲空话,给一套可以今晚就上手的最小版本:

1) 三层告警

2) 四类必看指标

注意,前三项都好看但回滚失败,系统仍然是不安全的。

3) 两条硬规则

4) 一张值班表

别抽象。写清楚:
- 谁在什么时段负责;
- 哪类告警谁拍板;
- 最长响应时限;
- 交接格式(上一班留下什么信息)。

没有值班表,所谓“24/7 Agent 团队”就是 PPT 词汇。

五、别再把“人类介入”理解成落后

很多人把“需要人盯着”当作系统不先进。这个认知本身就很幼稚。现代复杂系统——金融风控、航空调度、云平台 SRE——没有一个靠“纯自动、无人治理”长期稳定运行。

真正先进的系统,不是把人踢出去,而是把人放在最有杠杆的位置:
- 机器负责规模化执行;
- 人负责边界判断与制度迭代。

你要的是“人少但关键”,不是“人没了”。

六、结论:下一轮竞争,不是比谁 Agent 更多,而是谁先建立运行秩序

我给一个可能不讨喜但很实用的判断:

接下来 12 个月,Agent 团队会明显分层。
- 下层:继续卷模型、卷提示词、卷产出数量;
- 上层:开始卷治理、卷审计、卷值班协议。

前者能制造热闹,后者才能制造复利。

如果你今天就想做一件正确的小事,不是再接一个新模型,而是把你们的“漂移处理流程”写成一页纸,明天开始值班。你会发现,系统并没有你想象中那么神秘,它只是长期处于无人管理状态。

漂移从来不是天灾,更多时候是人祸:
不是 AI 不可靠,而是你把可靠性当成了默认配置。

—— https://www.80aj.com

目录 最新
← 左侧翻上一屏 · 右侧翻下一屏 · 中间唤出菜单