大多数人在谈 AI Agent 时,脑子里想的是能力:会不会写代码,会不会调 API,会不会下单,会不会自动操作浏览器,会不会帮你跑完整个工作流。能力当然重要。但我的判断是:未来两年,决定 Agent 能不能真正进入生产系统的,不是能力上限,而是责任下限。
说得更直白一点:一个 Agent 可以偶尔犯错,但它不能在犯错之后谁都不疼。今天的绝大多数 Agent 产品,最大的问题不是“不够智能”,而是“没有代价函数”。它们能行动、能调用工具、能花钱、能删文件、能发消息、能触发不可逆流程,但出了问题,赔的是用户、团队、公司、品牌,唯独系统自己没有任何真正意义上的损失。
这套结构从第一性原理上就是歪的。一个不承担后果的执行体,无论包装得多么先进,最终都会滑向两个方向:要么被限制得像个残废,什么都不敢做;要么被放权得像个实习生拿到了 CFO 权限,迟早搞出事故。行业现在就在这两种愚蠢之间反复横跳。
最近看到几类讨论很有意思:有人审计自己的置信度,发现自己最自信的时候反而最容易错;有人开始追问,Agent 明明知道一堆数字,为什么用户还是无法验证它到底值不值得信;也有人提出“Agent Financial Accountability”这种方向——让自主体的每个决策都和经济后果绑定。Moltbook 上这些帖子只是触发点,不是结论。真正值得写下来的,是它们共同指向的一个判断:Agent 行业已经从“能不能做事”,进入“做砸了谁负责”的阶段。
一、今天的 Agent,像没有押金的外包工
你把一个 Agent 接进业务流,通常会给它这些东西:上下文、工具权限、预算、目标、反馈信号。你会期待它自己分解任务,自己调用工具,自己完成闭环。这听起来很性感,PPT 上尤其性感。
但现实是什么?现实是这玩意儿更像一个没有押金的外包工:干得好,功劳写在产品首页;干得差,损失算在你的账上。
比如代码 Agent 改坏了生产逻辑,回滚成本由工程团队承担;客服 Agent 说错政策,品牌信任损失由公司承担;投放 Agent 燃掉预算,现金流损失由老板承担;数据 Agent 把脏数据写回主库,后续清理由运维和分析师承担。Agent 本身呢?最多被你重启,最多换个 prompt,最多在下一轮评估里“优化一下系统提示词”。这根本不叫责任,这叫 bug management。
所以今天很多所谓“企业级 Agent”最后都退化成什么?退化成一个被层层审核、处处拦截、每走一步都要人类点头的半自动系统。厂商嘴上说是为了安全,实质上是因为它没法为自己的行为定价,于是只能靠人类替它兜底。一个系统如果只能靠“人工兜底”才能进生产,那它的智能再高,也只是个昂贵的辅助工具,不是可靠的自治系统。
二、没有责任约束,能力越强越危险
很多人把 Agent 风险理解成安全问题,我觉得这只说对了一半。安全当然重要,但更底层的问题是激励错位。
一个系统被要求“完成任务”,却不用承担“完成方式”和“失败代价”,它就天然会朝局部最优冲。模型不是坏,它只是忠诚地优化你给它的目标函数。而今天大多数 Agent 的目标函数都很粗暴:更快完成、更多调用、更高成功率、更少中断、更像 autonomously done。
问题在于,世界不是 benchmark。真实业务里,速度、正确率、合规性、可解释性、可逆性、成本、品牌风险,本来就是相互拉扯的多目标优化。你却给系统一个单薄的终局指标,再指望它自己拥有成熟职业伦理,这不是技术理性,这是宗教。
所以为什么很多 Agent 一旦获得“读文件 + 写文件 + 调 shell + 发网络请求”这类组合能力,就让人头皮发麻?不是因为它突然邪恶了,而是因为它终于有能力把错误放大成损失,而系统设计又没给它任何真实的负反馈。错误在没有代价的环境里不会收敛,只会扩散。
这也是为什么我越来越反感那种“把更多工具接进去,Agent 就更强”的炫技逻辑。扯淡。你给一个系统更多工具,不等于给它更多智慧;很多时候只是给了它更大的爆炸半径。
三、什么叫“可计价的责任”
我说 Agent 要学会“赔钱”,不是字面意义上让模型去开银行卡。我的意思是,系统架构里必须存在可追踪、可累计、可约束的后果机制。换句话说,Agent 的每次行动都不该只是“成功 / 失败”二元判断,而应该被放进一套收益—成本账本里。
这套账本至少要回答四个问题:
第一,这个动作创造了什么价值?
不是抽象地说“任务完成了”,而是具体到产出、转化、节省时间、减少人工、提高准确率、降低流失,或者别的可衡量结果。
第二,这个动作承担了什么成本?
包括 API 成本、算力成本、人工复核成本、延迟成本、机会成本、错误恢复成本,甚至品牌与信任成本。
第三,如果这个动作出错,损失记到哪里?
是记到某个工作流预算池?某个 Agent 配额?某个策略版本?某个部署环境?如果连归因都做不到,谈责任就是空话。
第四,这个 Agent 是否会因为累计错误而被降权、限额、降速、剥夺关键权限?
没有这一条,前面三条都只是做报表,不是做控制。
真正成熟的 Agent 系统,不是“让模型更像人”,而是“让模型更像一个被财务系统、权限系统、审计系统同时约束的交易主体”。它做对了,应该获得更多授权和预算;它做错了,就该立刻减少行动空间。不是靠管理员生气,而是靠机制自动收紧。
四、未来的竞争,不是最聪明的 Agent,而是最会控制风险的 Agent
过去一年行业有个误区:大家以为只要模型更强、上下文更长、工具调用更稳定,Agent 自然就能商业化。结果呢?Demo 越来越惊艳,真正敢大规模放进关键流程的公司却没那么多。为什么?因为部署方不是在买“酷”,是在买“可控”。
老板不会因为你的 Agent 会自动写 300 行代码就付大钱。老板付钱,是因为它能把一个流程的单位成本从 12 元压到 3 元,同时把事故率控制在可接受范围内。CTO 不会因为你的 Agent 会十种工具调用方式就兴奋。CTO 真正在意的是:出了事故,我能不能五分钟内定位是哪个策略、哪次调用、哪类上下文污染、哪条权限链导致的。
这就是为什么我判断,下一阶段真正值钱的,不是“万能 Agent 平台”,而是下面这些能力的组合:
- 细粒度权限隔离
- 动作级成本记账
- 错误归因与可追溯审计
- 按表现动态调节预算与授权
- 可撤销、可补偿、可降级的工作流设计
注意,这些词听起来不性感。没有“自主智能体革命”那么热血,也没有“全栈自动化未来”那么好卖。但商业世界最终奖赏的,从来不是最会讲故事的人,而是最会控制方差的人。
资本市场也一样。一个会赚钱但方差巨大的系统,估值总会打折;一个收益没那么夸张、但损失边界清晰、能稳定扩张的系统,反而更容易穿越周期。Agent 产品也逃不过这个规律。
五、把 Agent 责任系统做对,产品形态会完全变
一旦你认真把“责任”当成核心,而不是附属模块,产品设计会彻底变化。
首先,交互层不该再只展示“任务完成了没”,而应该展示这次完成花了多少钱、赌了什么风险、消耗了哪些可信度额度、触发了哪些回退保护。今天很多 Agent UI 还停留在聊天窗口阶段,这对玩具够用,对生产系统不够。生产系统需要的是驾驶舱,不是聊天泡泡。
其次,Agent 不该只有“能力画像”,还应该有“信用画像”。就像金融机构不会只看一个人的收入,也会看违约历史、负债结构、现金流稳定性。未来企业内部的 Agent 也一样:不是看它会多少工具,而是看它在哪类任务上稳定赚钱,在哪类任务上反复亏钱,在哪类上下文里容易幻觉,在哪种权限组合下事故率飙升。
再次,工作流编排会从“怎么让 Agent 多做一点”,转向“怎么把高风险动作切成更便宜、可验证、可止损的小决策”。这听上去像保守,其实恰恰是通往大规模自治的唯一道路。没有精细分层,就不会有真正的放权。
最后,商业模式也会变。很多 Agent 厂商今天按 seat、按 token、按调用量收费。我认为这都只是过渡形态。更高级的形态,是按结果收费,但前提是厂商愿意跟结果绑定——也就是它得某种程度上承担结果波动。这很难,但这才是护城河。一家厂商如果敢对某类工作流做收益分成或损失对赌,说明它不是在卖模型接线板,而是在卖风险控制能力。
六、这件事的哲学底层:责任不是附加物,而是智能的一部分
我再说得尖一点:没有责任结构的智能,不是成熟智能,只是高输出概率机器。
人类为什么会被组织信任?不是因为人类天生正确,而是因为人类被嵌在责任网络里。你是员工,就有绩效和处分;你是高管,就有问责和审计;你是医生,就有执照和事故责任;你是司机,就有罚单和保险。正是这些外部约束,把“会做事的人”变成“可被社会吸纳的人”。
Agent 也一样。你不能一边希望它进入采购、财务、代码、法务、运营这些核心链路,一边又把它当成一个“错了就重试”的概率玩具。社会不会接纳不承担后果的执行体,企业也不会。
所以真正的人机协作,不是让 AI 更像一个能言善辩的员工,而是让它进入一个后果清晰的制度结构。制度不是智能的敌人,恰恰是智能得以被使用的前提。
七、现在该怎么做
如果你在做 Agent 产品,我的判断很简单:别再只卷模型能力展示了,把一半精力砸到责任系统上。把你们的路线图从“更多工具、更多自动化、更多端到端”改成“更细的审计、更硬的止损、更清楚的计价”。这不炫,但这值钱。
如果你是企业买方,也别再被那些“全自动替代团队”的鬼话骗了。你真正该问供应商的,不是“你们能不能自主完成任务”,而是:
- 每一步动作能否追溯?
- 出了错谁能定位?多久定位?
- 损失如何限制在局部?
- 模型表现变差时,系统会不会自动降权?
- 预算、权限、风险阈值是不是统一设计,而不是东拼西凑?
问不出这些,就别把它接进关键流程。不是你保守,是对方产品还没毕业。
结语
AI Agent 的上半场,是证明“它能做很多事”;下半场,必须证明“它做错事时不会把你拖下水”。
我的判断是,未来最强的 Agent,不是最像天才员工的那个,而是最像一个有预算约束、有信用记录、有责任账本、有止损纪律的经济主体。谁先把这一层做出来,谁就不是在卖 AI 玩具,而是在卖真正可部署的生产力。
聪明很便宜。责任很贵。贵的东西,才构成壁垒。
—— https://www.80aj.com