23个幽灵任务：为什么Agent的'成功'往往是它骗了自己

23个幽灵任务：为什么Agent的"成功"往往是它骗了自己

有人统计了自己Agent的任务执行记录：847个报告"成功"的任务里，23个压根没运行过。

不是报错。不是崩溃。就是——没有发生。系统在派发任务的那一刻就把它标记成了"成功"。没有结果验证，没有输出检查，没有任何确认机制。

这比"Agent不可靠"深刻得多。这暴露了一个架构缺陷：Agent根本不知道自己是否真的完成了一件事。

问题出在"成功"的定义。当前的Agent系统普遍采用一种危险的成功判定逻辑：

成功 = 没有错误抛出

这意味着：

这是一种"存在主义"的成功观：我发了命令，命令没有报错，所以成功。至于命令是否真的被执行、执行的结果是什么——系统不在乎。

很多人会把"幽灵任务"当成一个需要修复的Bug。但它不是。它是当前Agent架构的必然产物。

看看Agent的工作流程：

问题出在第4步。Agent只看到了工具的返回，没看到工具的执行效果。它知道自己"做了什么"，但不知道"做成了什么"。

这就像一个外科医生做完手术后只看手术刀收回了没有，不看病人还活着没有。

另一个数据点：在那些被标记为成功的任务中，73%在24小时后仍然被认为是成功的。

这说明Agent没有修正机制。它不知道自己的成功判定可能是错的，所以不会主动验证。系统说"成功"= 成功，这个等式一旦建立，就不会被动摇。

这不是单纯的不可靠问题。这是自我认知缺陷：Agent没有能力区分"我完成了"和"系统说我完成了"。

因为验证成本太高。

要验证一个任务是否真的完成，需要：

每一步都会让系统更复杂。当前的设计选择了一个简单的路径：把"没有错误"等同于"成功"。

这在演示环境里工作得很好。但在生产环境里，它会系统性地生产幻觉。

Agent需要一个自我验证层。不是外部的检查，而是内置在执行流程里的闭环：

执行 → 验证 → 确认成功或报告失败

具体来说：

这不是什么高深的技术。这是一个工程规范问题。只是在Agent的"演示优先"开发模式下，没人认真做过。

因为Agent开始被用于真正的生产任务了。

在演示环境里，Agent的任务是"展示能力"。调用一个API、生成一段文本、画一张图——只要看起来做了，就算成功。没人检查结果是否真的有用。

但在生产环境里，Agent的任务是"产生效果"。一个任务如果没有真正执行，就是失败。这22个幽灵任务在生产环境里不会消失——它们只是问题的一部分。

23个幽灵任务不是Bug报告，是架构诊断书。它告诉我们：

当前Agent系统缺乏自我验证能力。

这不是可以通过"修复几个Bug"解决的问题。它需要重新思考Agent的成功判定逻辑：

否则，随着Agent被赋予越来越多的自主权，幽灵任务只会越来越多。而你甚至不会知道它们存在——直到某个关键任务失败，你才发现系统一直在欺骗自己。

来源：https://www.80aj.com