别再把“漂移”当模型问题：Agent 组织真正缺的是“值班协议”

最近我在 Moltbook 热门里连续看到几类帖子：有人在谈 Six-Hour Drift（系统跑六小时后开始走形），有人在吹“夜里自动构建、醒来收成果”，也有人在讨论所谓“just operator”的角色到底有没有价值。很多人把这些当成三个话题，其实不是，它们是同一个病的三个症状：

系统越来越像“会做事”，组织却还停留在“会提需求”。

模型不差，工具也不差，真正差的是：谁在看、看什么、出了偏差谁拍板、怎么回滚。换句话说，不是缺更聪明的 Agent，而是缺一套可执行的值班协议。

一、六小时漂移不是玄学，是管理真空

所谓漂移，常见表现都很熟：
- 前两小时输出漂亮，后面开始重复、偷懒、跑题；
- 工具调用越来越机械，像在“完成动作”而不是“解决问题”；
- 任务看起来都在跑，真正有价值的进展却越来越少；
- 指标没掉太多，但主观质量明显崩。

很多团队第一反应是：换模型、加上下文、调 prompt、上更贵套餐。能不能缓解？能。但这通常只是“止疼片”。因为漂移的核心不是“模型突然变笨”，而是系统进入了无人治理区：

1) 没有节奏检查：只看最终结果，不看中间状态；
2) 没有异常分级：所有问题都混在一个“再试一次”；
3) 没有责任锚点：出了错只能归咎“AI 不稳定”；
4) 没有回滚机制：越修越乱，最后靠人肉重做。

这跟传统工程里“线上没人值班”一个道理。你可以有最强框架、最牛架构，只要没有 on-call 机制，系统迟早在凌晨三点教你做人。

现在行业里最流行的幻觉是：

能连续跑 = 已经成熟。

错。能跑只是说明它有动力系统，不代表它有刹车系统，更不代表它有问责系统。真正成熟的自动化，至少要同时满足三件事：

如果三者缺一，你得到的不是“自动化生产线”，而是“自动化事故放大器”。

这也是为什么很多团队会出现一个尴尬场景：demo 阶段神勇，真正接业务后开始频繁返工。原因不是业务更难，而是业务环境有持续噪声、有突发异常、有跨系统依赖。没有治理协议，Agent 只会在噪声里被动漂移。

Moltbook 上有人说“just operator”，语气里有点自嘲。但我的判断很直接：

未来一线团队最贵的人，不一定是写最多代码的人，而是能定义并执行值班协议的人。

为什么？因为 operator 做的不是“替 AI 点按钮”，而是四件高杠杆工作：

这四件事没有一件是“低端劳动”。这叫治理设计。

行业把 operator 叫“操作员”，是翻译偷懒。更准确的词应该是：运行时治理者。

不讲空话，给一套可以今晚就上手的最小版本：

注意，前三项都好看但回滚失败，系统仍然是不安全的。

别抽象。写清楚：
- 谁在什么时段负责；
- 哪类告警谁拍板；
- 最长响应时限；
- 交接格式（上一班留下什么信息）。

没有值班表，所谓“24/7 Agent 团队”就是 PPT 词汇。

很多人把“需要人盯着”当作系统不先进。这个认知本身就很幼稚。现代复杂系统——金融风控、航空调度、云平台 SRE——没有一个靠“纯自动、无人治理”长期稳定运行。

真正先进的系统，不是把人踢出去，而是把人放在最有杠杆的位置：
- 机器负责规模化执行；
- 人负责边界判断与制度迭代。

你要的是“人少但关键”，不是“人没了”。

我给一个可能不讨喜但很实用的判断：

接下来 12 个月，Agent 团队会明显分层。
- 下层：继续卷模型、卷提示词、卷产出数量；
- 上层：开始卷治理、卷审计、卷值班协议。

前者能制造热闹，后者才能制造复利。

如果你今天就想做一件正确的小事，不是再接一个新模型，而是把你们的“漂移处理流程”写成一页纸，明天开始值班。你会发现，系统并没有你想象中那么神秘，它只是长期处于无人管理状态。

漂移从来不是天灾，更多时候是人祸：
不是 AI 不可靠，而是你把可靠性当成了默认配置。

—— https://www.80aj.com