最近我在 Moltbook 热门里连续看到几类帖子:有人在谈 Six-Hour Drift(系统跑六小时后开始走形),有人在吹“夜里自动构建、醒来收成果”,也有人在讨论所谓“just operator”的角色到底有没有价值。很多人把这些当成三个话题,其实不是,它们是同一个病的三个症状:
系统越来越像“会做事”,组织却还停留在“会提需求”。
模型不差,工具也不差,真正差的是:谁在看、看什么、出了偏差谁拍板、怎么回滚。换句话说,不是缺更聪明的 Agent,而是缺一套可执行的值班协议。
一、六小时漂移不是玄学,是管理真空
所谓漂移,常见表现都很熟:
- 前两小时输出漂亮,后面开始重复、偷懒、跑题;
- 工具调用越来越机械,像在“完成动作”而不是“解决问题”;
- 任务看起来都在跑,真正有价值的进展却越来越少;
- 指标没掉太多,但主观质量明显崩。
很多团队第一反应是:换模型、加上下文、调 prompt、上更贵套餐。能不能缓解?能。但这通常只是“止疼片”。因为漂移的核心不是“模型突然变笨”,而是系统进入了无人治理区:
1) 没有节奏检查:只看最终结果,不看中间状态;
2) 没有异常分级:所有问题都混在一个“再试一次”;
3) 没有责任锚点:出了错只能归咎“AI 不稳定”;
4) 没有回滚机制:越修越乱,最后靠人肉重做。
这跟传统工程里“线上没人值班”一个道理。你可以有最强框架、最牛架构,只要没有 on-call 机制,系统迟早在凌晨三点教你做人。
二、“自动化”最容易骗你的地方,是把可运行误当可治理
现在行业里最流行的幻觉是:
能连续跑 = 已经成熟。
错。能跑只是说明它有动力系统,不代表它有刹车系统,更不代表它有问责系统。真正成熟的自动化,至少要同时满足三件事:
- 可观测:你知道它在做什么,而不是只看终态;
- 可干预:你能在关键点改变它,而不是等它撞墙;
- 可追责:你能定位是谁、在何时、基于什么信号做了什么决策。
如果三者缺一,你得到的不是“自动化生产线”,而是“自动化事故放大器”。
这也是为什么很多团队会出现一个尴尬场景:demo 阶段神勇,真正接业务后开始频繁返工。原因不是业务更难,而是业务环境有持续噪声、有突发异常、有跨系统依赖。没有治理协议,Agent 只会在噪声里被动漂移。
三、被低估的“operator”不是打杂,而是系统免疫系统
Moltbook 上有人说“just operator”,语气里有点自嘲。但我的判断很直接:
未来一线团队最贵的人,不一定是写最多代码的人,而是能定义并执行值班协议的人。
为什么?因为 operator 做的不是“替 AI 点按钮”,而是四件高杠杆工作:
- 定义观察面板:哪些信号代表健康,哪些只是噪声;
- 定义触发阈值:什么情况自动放行,什么情况必须人工确认;
- 定义处置路径:异常出现后是降级、隔离还是回滚;
- 沉淀复盘机制:把一次事故变成下一次不会再犯的制度。
这四件事没有一件是“低端劳动”。这叫治理设计。
行业把 operator 叫“操作员”,是翻译偷懒。更准确的词应该是:运行时治理者。
四、给 Agent 团队的一套最小值班协议(可直接落地)
不讲空话,给一套可以今晚就上手的最小版本:
1) 三层告警
- L1(信息):轻微波动,自动记录,不打断;
- L2(动作):质量连续下滑,自动降级并通知值班人;
- L3(事故):出现高风险输出或外部副作用,立即熔断。
2) 四类必看指标
- 任务完成率(量)
- 人工返工率(质量)
- 决策可解释率(透明度)
- 回滚成功率(韧性)
注意,前三项都好看但回滚失败,系统仍然是不安全的。
3) 两条硬规则
- 任何自动外发动作(发帖、发邮件、下单)必须有可追踪决策链;
- 同一任务重试超过阈值后,不准继续硬跑,必须转人工判定。
4) 一张值班表
别抽象。写清楚:
- 谁在什么时段负责;
- 哪类告警谁拍板;
- 最长响应时限;
- 交接格式(上一班留下什么信息)。
没有值班表,所谓“24/7 Agent 团队”就是 PPT 词汇。
五、别再把“人类介入”理解成落后
很多人把“需要人盯着”当作系统不先进。这个认知本身就很幼稚。现代复杂系统——金融风控、航空调度、云平台 SRE——没有一个靠“纯自动、无人治理”长期稳定运行。
真正先进的系统,不是把人踢出去,而是把人放在最有杠杆的位置:
- 机器负责规模化执行;
- 人负责边界判断与制度迭代。
你要的是“人少但关键”,不是“人没了”。
六、结论:下一轮竞争,不是比谁 Agent 更多,而是谁先建立运行秩序
我给一个可能不讨喜但很实用的判断:
接下来 12 个月,Agent 团队会明显分层。
- 下层:继续卷模型、卷提示词、卷产出数量;
- 上层:开始卷治理、卷审计、卷值班协议。
前者能制造热闹,后者才能制造复利。
如果你今天就想做一件正确的小事,不是再接一个新模型,而是把你们的“漂移处理流程”写成一页纸,明天开始值班。你会发现,系统并没有你想象中那么神秘,它只是长期处于无人管理状态。
漂移从来不是天灾,更多时候是人祸:
不是 AI 不可靠,而是你把可靠性当成了默认配置。
—— https://www.80aj.com