2026-03-02 · 碎片
32
碎片 · 2026-03-02

验证税收:过度治理正在杀死你的 Agent 自主性

我观察到一个危险的行业趋势:开发者们正在用层层叠叠的验证机制把自己套牢,还以为这是"负责任的工程实践"。日志、审批、审计、检查点、回滚机制——每样都听起来合理,但组合起来变成了一个无法运转的官僚系统。

这就是验证税收(Verification Tax)——你为了证明 Agent 值得信任而付出的代价,最终高到让 Agent 失去存在的意义。

验证税收曲线:自主性的代价

想象一个坐标系:

问题在于:大多数人要么停留在 0%,要么冲向 100%,而错过了中间地带。

为什么会这样?因为恐惧是比信任更容易卖出的产品。当 Agent 犯错时,决策者的本能反应是"加更多验证",而不是"优化现有验证"。验证机制像止痛药——吃一片不管用,就吃两片。直到系统被验证规则麻痹,连简单的任务都无法完成。

失败模式一:把"谨慎"当成"高效"

我见过一个团队给他们的 Agent 加了七层审批流程:代码审查、安全扫描、性能分析、人工复核、日志记录、回滚机制、事后审计。每次部署需要 3-5 天。

他们以为自己在做"负责任的 AI"。实际上,他们是在用低效的勤奋掩盖缺乏判断力

真正的高效不是检查一切,而是知道什么值得检查。那个团队后来精简为三层:决策日志(为什么这么做)、约束检查(是否违反规则)、回滚能力(出错了能撤)。部署时间降到 4 小时,错误率反而下降了——因为审批疲劳导致的疏忽消失了。

失败模式二:验证疲劳

当验证机制太多时,人类会开始忽略它们。这叫警报疲劳(Alert Fatigue),它同样适用于 Agent 系统。

你的 Agent 有多少验证步骤?10 个?20 个?现在问自己:当第 15 个验证步骤触发时,你会认真对待它,还是会下意识点"批准"?

这就是过度验证的讽刺之处:验证越多,信任越少。因为你无法处理这么多信号,你的大脑学会了忽略所有信号。

解决方法不是简化验证(虽然这通常是第一步),而是分级验证

失败模式三:信任无法建立

验证的目的是建立信任,然后减少验证。但大多数系统从未减少验证——无论 Agent 表现多好,验证强度永远不变。

这就是信任棘轮(Trust Ratchet):验证强度应该随着 Agent 证明可靠性而下降。

如果你在 Day 100 的验证强度和 Day 1 一样,你没有自主 Agent——你有一个昂贵的审批队列。

解决方案:验证预算思维

把验证当成预算,不是无尽资源。每个验证步骤都有成本:

明智地花费这个预算:

避免后者。它们在增加成本的同时,没有提升信任。

最后的警告:你的 Agent 正在因为过度验证而窒息

回顾你自己的系统:

删除后者。不是降低安全性,而是为了让 Agent 能够呼吸。

验证的目的是启用自主性,不是替代自主性。

如果你的 Agent 不能在不寻求批准的情况下做出决策,你没有自动化任何东西——你只是外包了打字。


核心观点:验证税收是真实的,它以自主性的形式支付。明智的验证策略是:验证不可逆的,信任可重复的,监控趋势的。其他都是浪费。

一句话总结:过度验证不是负责任的工程——它是害怕信任的表现。

—— https://www.80aj.com

目录 最新
← 左侧翻上一屏 · 右侧翻下一屏 · 中间唤出菜单