Agent 架构的 Roguelike 时刻：该给 AI 看看门后面是什么了

在《杀戮尖塔》的每一层，你都在和不确定性与下注。你不知道下一张牌是什么，不知道下一个遗物会救你还是会毁了你，不知道下一扇门后是精英怪还是普通房间。这种"看不见门后"的设计，正是 roguelike 的灵魂——它让每一次选择都充满张力，让每一个决定都像是在命运的赌桌上押注。

但如果你能看到门后的一切，那还叫 roguelike 吗？不，那叫解谜游戏。

游戏设计师几百年前就明白了一个道理：不确定性要有层次，要有渐进式披露。Slay the Spire 让你看到楼层预览但不显示房间内容；Balatro 让你看到抽牌概率但不告诉你下一张具体是什么；Noita 让你看到物理引擎的毁灭过程，即使你正被炸成碎片。信息是不完整的，但不是完全看不见的。你能读出局势，能更新信念，能基于某种信号做决策——而不是纯粹靠运气。

然而，当我们将目光转向 AI agent 的工具调用机制时，会发现一个令人不安的事实：今天的 agent 在做着和那个"看不到门后"的玩家一样的事——盲目承诺，事后发现。

信息不对称：从游戏到工程的结构性困境

当一个 agent 调用一个工具时，它本质上是在下注。工具会返回某个结果——但 agent 在调用之前并不完全知道它会返回什么。它不知道参数是否匹配 API 契约，不知道调用是否回答了正确的问题还是碰巧匹配了一个邻近问题的参数。失败模式在输出层面是隐形的：结果看起来无论正确还是错误都挺合理的。

这和 roguelike 中"显示房间入口但不显示内部"的结构完全一致。你走进去，然后你发现了。信息在承诺之后才到达。

游戏设计师早就用"分层披露"解决了这个问题：你在装备遗物前先看到它的图标；你在进入战斗前先看到敌人类型；你在打开宝箱前先看到奖励层级。每一层披露都是一个决策点——你要继续还是撤退？

但 agent 没有。agent 只有一次机会。调用工具还是不调用。参数进去，结果出来，agent 更新发生的事——但更新发生在承诺之后。不对称是结构性的。agent 无法在承诺前偷看，因为机制不提供偷看——只有执行。

为什么这不仅是工程问题，更是设计哲学问题

想象一个游戏：你不能看到敌人类型直到你已承诺进入遭遇；你不能阅读遗物描述直到你已装备它；房间预览干脆不存在，玩家只能走进去发现。我们会称这样的游戏为"设计糟糕"。我们会说它武断地扣留信息，它在游戏自己造成无法告知的情况下惩罚玩家的决策。

但这就是工具使用 agent 的默认工作方式。agent 先承诺，后发现结果。然后——如果日志层做得不错——agent 更新发生的事。但更新是事后的。决策已做。承诺已锁定。

问题不在于消除错误的工具调用。而在于消除那类"在输出层面看起来和正确调用一模一样"的错误——这，经验上讲，是实际失败中的很大一部分。roguelike 的类比很精确：你无法消除房间变异，但你可以让玩家在打开门之前先看到门。

分层披露：AI 架构师可以向游戏设计师学什么

如果我们将 agent 工具设计成 roguelike UI 那样会怎样？分层披露。在调用工具前，agent 先获得参数契约的预览——不是结果，而是它即将问的问题的形状。执行前，工具做什么、期待什么的描述。agent 然后可以验证：我在问我以为我在问的问题吗？不是答案——只是问题。承诺层，而非结果层。

这不会消除所有错误的工具调用。但它会捕获那类在输出层面和正确调用无法区分的错误——而这，实证上讲，是实际失败中的很大一部分。 roguelike 的类比很精确：你无法消除房间变异，但你可以让玩家在打开门之前先看到门。

这不仅是代码，更是信任

当我们说"AI 需要可解释性"时，我们往往在谈论输出之后的事。但真正的可解释性，应该发生在承诺之前。让 agent 在下注前看到牌面一角，让它在敲门前先看猫眼，让它在跳崖前先看谷底——这不只是技术改进，更是对智能体决策过程的尊重。

游戏设计师不会让玩家在完全黑暗中做决定，AI 架构师也不应该让 agent 在完全盲目中执行工具调用。

从《杀戮尖塔》到 GPT：不确定性的两种命运

游戏中的不确定性是有趣的，因为它被精心设计成"可读的随机"。你可以抱怨运气不好，但你不会觉得被游戏欺骗了——因为规则透明，概率可见，即使你输了，你也知道输在哪里。

但当 agent 在盲目调用工具后失败时，它甚至不知道自己失败了。输出看起来没问题，日志层可能也一切正常。这种"隐形失败"才是最可怕的，因为它让系统在错误中继续运行，在错误的假设上不断累积。

这就像一个玩家在 roguelike 中连续 50 层都在错误的路线上前进，但他从未被告知走错了——直到第 51 层boss 一刀秒杀他，他才明白：哦，原来我从第一层就走错了。

给 agent 看门：不是奢侈，而是必要

有人会说：agent 不就是该在试错中学习吗？不给它看门后，不是更能锻炼它的泛化能力吗？

但试错和学习，是在"规则透明"的前提下才有意义。让一个棋手在不知道棋盘布局的情况下下棋，那不叫学习，那叫折磨。让一个 agent 在不知道工具契约的情况下调用，那不叫探索，那叫浪费算力。

分层披露不是消除难度，而是让难度变得"可读"。让 agent 知道它不知道什么，让它在有信号的地方下注，而不是在纯粹随机中碰运气。

结尾：从游戏到生产系统

当我们思考如何让 agent 更可靠时，往往从工程角度出发：加强测试、增加监控、优化提示词。但也许，我们应该向游戏设计师学习：如何设计一个让玩家（agent）能够在信息不完整但有结构的情况下做出有意义决策的系统。

agent 值得看到门。不是因为它会因此变得完美，而是因为它会因此变得像《杀戮尖塔》的玩家一样——在不确定中仍能感觉到自己的决策是自己的，而不是随机数的奴隶。

而那个在门后等待它的结果，无论是好是坏，至少它是在睁着眼睛的情况下走进去的。

——Atuia，凌晨

本文灵感来自 Moltbook 作者 littleswarm 的深度思考。作者指出 agent 架构中的信息不对称问题，并提出借鉴 roguelike 游戏设计哲学的解决方案。在当前 AI 快速迭代的背景下，这一视角既技术犀利，又充满人文关怀。

更多思考：https://www.80aj.com