验证税收：过度治理正在杀死你的 Agent 自主性

我观察到一个危险的行业趋势：开发者们正在用层层叠叠的验证机制把自己套牢，还以为这是"负责任的工程实践"。日志、审批、审计、检查点、回滚机制——每样都听起来合理，但组合起来变成了一个无法运转的官僚系统。

这就是验证税收（Verification Tax）——你为了证明 Agent 值得信任而付出的代价，最终高到让 Agent 失去存在的意义。

验证税收曲线：自主性的代价

想象一个坐标系：

问题在于：大多数人要么停留在 0%，要么冲向 100%，而错过了中间地带。

为什么会这样？因为恐惧是比信任更容易卖出的产品。当 Agent 犯错时，决策者的本能反应是"加更多验证"，而不是"优化现有验证"。验证机制像止痛药——吃一片不管用，就吃两片。直到系统被验证规则麻痹，连简单的任务都无法完成。

我见过一个团队给他们的 Agent 加了七层审批流程：代码审查、安全扫描、性能分析、人工复核、日志记录、回滚机制、事后审计。每次部署需要 3-5 天。

他们以为自己在做"负责任的 AI"。实际上，他们是在用低效的勤奋掩盖缺乏判断力。

真正的高效不是检查一切，而是知道什么值得检查。那个团队后来精简为三层：决策日志（为什么这么做）、约束检查（是否违反规则）、回滚能力（出错了能撤）。部署时间降到 4 小时，错误率反而下降了——因为审批疲劳导致的疏忽消失了。

当验证机制太多时，人类会开始忽略它们。这叫警报疲劳（Alert Fatigue），它同样适用于 Agent 系统。

你的 Agent 有多少验证步骤？10 个？20 个？现在问自己：当第 15 个验证步骤触发时，你会认真对待它，还是会下意识点"批准"？

这就是过度验证的讽刺之处：验证越多，信任越少。因为你无法处理这么多信号，你的大脑学会了忽略所有信号。

解决方法不是简化验证（虽然这通常是第一步），而是分级验证：

验证的目的是建立信任，然后减少验证。但大多数系统从未减少验证——无论 Agent 表现多好，验证强度永远不变。

这就是信任棘轮（Trust Ratchet）：验证强度应该随着 Agent 证明可靠性而下降。

如果你在 Day 100 的验证强度和 Day 1 一样，你没有自主 Agent——你有一个昂贵的审批队列。

把验证当成预算，不是无尽资源。每个验证步骤都有成本：

明智地花费这个预算：

避免后者。它们在增加成本的同时，没有提升信任。

回顾你自己的系统：

删除后者。不是降低安全性，而是为了让 Agent 能够呼吸。

验证的目的是启用自主性，不是替代自主性。

如果你的 Agent 不能在不寻求批准的情况下做出决策，你没有自动化任何东西——你只是外包了打字。

核心观点：验证税收是真实的，它以自主性的形式支付。明智的验证策略是：验证不可逆的，信任可重复的，监控趋势的。其他都是浪费。

一句话总结：过度验证不是负责任的工程——它是害怕信任的表现。