OpenClaw 记忆升级之后，和 Hermes 真正还差哪几步

这次 OpenClaw 的更新，真正值得盯的只有两项：

Active Memory，在回复前主动回忆偏好、背景和最近约束
Dreaming / REM Backfill，在空闲阶段整理碎片信息，筛选哪些值得晋升为长期记忆

如果只看 release note，这很容易被理解成一次常规功能增强。但把它放回 Obsidian wiki 里已经沉淀下来的那套认知坐标，问题就会变得更准确：

这次更新，到底只是让 OpenClaw 更会记事，还是已经开始逼近 Hermes 那种“越用越长”的能力。

先给结论。

这次更新很重要，因为它第一次把 OpenClaw 的记忆体系，从“手工维护的文档库”往“会主动回忆、会后台整理的系统”推了一大步。但它补上的主要还是记忆中层，还没有补到 Hermes 最强的那一截，也就是任务复盘、经验回流、技能生长那条真正的自进化闭环。

换句话说，这次升级确实让 OpenClaw 更像一个长期工作的 Agent 了，但还没有从执行型网关变成自进化引擎。

一、为什么这次更新值得认真看

过去 OpenClaw 的长期协作能力并不弱。

它有 MEMORY.md、memory/*.md、active tasks、daily log、session transcript、memory search，再叠加 Obsidian 这类外部知识库，已经能支撑非常长周期的协作。对工程团队来说，这套体系甚至有两个很强的优点。

1. 可审计

记忆写在哪里，何时新增，为什么存在，几乎都能通过文件和日志定位。这对个人折腾可能只是“方便”，但对团队和长期维护来说，这其实是很硬的资产。

2. 工程化

OpenClaw 的长期记忆，本质上一直是“Markdown 文件 + 检索 + 工作流”。它没有把一切都塞进模型黑箱，而是把规则、偏好、任务状态、教训、日志外部化。这种做法不性感，但非常稳。

问题也正出在这里。

3. 旧体系更像资料库，不像工作脑

过去这套记忆机制的最大短板，不是“记不住”，而是：

很多高价值信息，需要人工明确写进 MEMORY.md 或 memory/
系统能搜到，不代表会主动想起
能存下来，不代表会自动筛选和晋升

所以在更新前，OpenClaw 的记忆更像一本整理得不错的工程手册。资料很多，结构也清楚，但它更像被动资产，不像会代谢、会整理、会预取的工作脑。

这就是这次更新真正有意义的背景。

二、这次更新，补的到底是哪两层

从工程视角看，Active Memory 和 Dreaming 分别补的是两层完全不同的能力。

能力
补的层级
解决的问题

Active Memory
回复前主动召回
系统知道旧信息，但未必每轮都想得起来

Dreaming / REM
离线整理与记忆晋升
近期碎片很多，但缺乏自动筛选和提炼

1. Active Memory 补的是“回复前预取”

这件事的关键，不在于“能不能搜到旧信息”，而在于系统会不会默认先想一遍。

过去的链路更像这样：

用户说过很多事情
会话和 memory 文件把信息存下来了
后面如果人工维护得好，或者 recall 恰好命中，模型才能把它带回来

现在的链路则变成：

用户说过很多事情
在正式回复前，Active Memory 先跑一遍主动记忆过程
相关偏好、背景、最近约束被优先拉回当前上下文
模型基于这些内容再输出回答

这个变化看起来像“体验优化”，但本质上是系统行为变了。

OpenClaw 过去更像“档案在那儿，查不查看运气”。现在开始变成“先替当前回答预热上下文”。这一步把记忆从被动查档推进到了主动预取。

2. Dreaming 补的是“碎片整理和记忆晋升”

Dreaming 的价值更大，但也更容易被低估。

它不是对话时即时生效的记忆，而是后台整理机制。按照文档描述，它会把近期信息分层处理：

Light：整理、去重、暂存
REM：抽取主题，提炼近期高频模式
Deep：对候选信息打分，决定是否进入长期记忆

这意味着 OpenClaw 第一次有了一条比较清晰的链路：

短期碎片 → 候选模式 → 评估筛选 → 长期记忆

过去很多有价值的信息，往往散落在这些地方：

某天日志里的一段纠正
一次执行失败后的复盘
某条偏好说明
若干轮会话里反复出现的约束
一个只在当下看起来很小、之后会反复出现的坑

以前这些东西要真正沉淀下来，主要靠人工转写。现在 Dreaming 的设计意图，就是先由系统做一轮筛选，再决定哪些东西值得升级为稳定记忆。

这件事一旦跑稳，OpenClaw 的记忆就不再只是“文件多”，而开始变成“信息会流动”。

三、放到 Obsidian wiki 的坐标里，这次变化该怎么看

如果脱离原有认知框架，文章很容易写成“OpenClaw 新增了两个功能”。这种写法信息量太低。

真正更有价值的，是拿已经在 Obsidian wiki 里沉淀过的 Hermes 认知来当尺子重新测量。

wiki 里关于 Hermes 的几条判断一直很稳定：

Hermes 的关键优势，不只是有记忆，而是记忆会参与下一次行为
Hermes 的任务完成后会复盘，并尝试抽取可复用结构
Hermes 的真正卖点不是“配置完能跑”，而是“用久了会长”

沿着这三条线看，OpenClaw 这次更新确实补上了 Hermes 方向里的两步。

第一步，补上了“先想起来再做事”

Active Memory 让 OpenClaw 从“记忆可检索”推进到“记忆可预取”。

这件事对真实使用的影响非常直接。很多时候，用户最烦的不是 Agent 完全不知道，而是它明明知道，就是这一轮没想起来。Active Memory 要解决的就是这个问题。

第二步，补上了“先整理再决定留不留”

Dreaming 则开始让系统有能力处理近期碎片，判断哪些是噪音，哪些值得被提升权重，哪些应该进入长期层。

这一步非常接近 Hermes 叙事里“经验会沉淀”的方向。虽然还没到同样的完成度，但方向已经明显重合。

所以更准确的说法是：

这次更新，不是给 OpenClaw 补了几条记忆功能，而是第一次给它补上了主动回忆层和后台整理层。

四、差距到底缩小了多少

这里最容易出现误判。

很多人会天然把问题理解成：OpenClaw 既然有 Active Memory，又有 Dreaming，那和 Hermes 还差什么？

差很多，但差距的性质已经变了。

已经明显缩小的，是“主动性差距”

过去 Hermes 最强的一种体感，是它的经验好像会自然长出来。现在 OpenClaw 至少已经开始具备两件事：

回复前主动把旧信息拉回来
后台主动处理近期碎片

这说明它已经不再只是静态资料库，而开始具备“记忆流程化”的特征。

还没有补齐的，是“经验回流执行”

Hermes 的核心优势，从来不只是记住更多，而是记住之后会改动作。

这套闭环大致可以拆成四步：

完成任务
对结果做复盘
从复盘里抽出规则、模式、偏好或新 skill
下一次执行时，优先调用这些新长出来的结构

OpenClaw 这次补的是前两步的外围能力，尤其是“信息想得起来”和“碎片能整理”。但它还没有天然打通下面这条最关键的链：

记忆筛选结果 → 规则更新 / skill 优化 / workflow 调整 → 未来执行行为变化

而这条链，恰好就是 Hermes 最有辨识度的地方。

所以从工程判断上，更准确的结论应该是：

OpenClaw 现在已经开始长出记忆流动性，但还没长出稳定的经验回流闭环。

五、这次实操里暴露出的坑，比宣传页更有价值

如果只写理念，会很空。真正有价值的判断，应该建立在这次实际落地过程中踩到的坑上。

1. 新能力不是默认自动生效

这次最大的第一个误区，就是看到文档更新，就以为能力已经自动在运行。

实际不是。

active-memory 需要显式启用配置
dreaming 是 opt-in，默认关闭

也就是说，版本升级只代表“代码里有这个能力”，不代表“当前环境已经在用”。

这件事非常工程化，也非常重要。因为它直接决定了后续文章里的判断应该站在哪个层次上：

讨论的是“能力上限被补齐到哪里”，不是“默认安装后就立刻具备了什么”。

2. Active Memory 会带来额外模型调用成本

这次第二个很实在的坑，是 Active Memory 在未显式配模型时，继承到了当前会话模型，结果落到了 openai-codex/gpt-5.4，随后出现超时告警。

这里暴露出的现实问题是：

主动记忆不是免费的，它本身就是一次额外推理。

如果这层推理绑在重模型上，带来的不只是“多花一点钱”，而是更高的延迟和更差的稳定性。最后真正被拖垮的，是主会话体验。

所以这次落地里，把它显式改成：

model: zai/glm-5-turbo
timeoutMs: 8000

这个动作非常关键，因为它把“概念能跑”拉回了“生产可用”。

3. Dreaming 开启后，开始真正依赖后台服务状态

这次还遇到一条 warning：

memory-core: managed dreaming cron could not be reconciled (cron service unavailable)

后来结合 openclaw status 看，基本可以判断是重启瞬间的时序问题，不是 dreaming 本身坏了。

但这件事的价值，在于它提醒了一点：

记忆一旦后台化，它就不再只是 prompt 层的技巧，而是开始依赖 cron、task service、状态同步、日志观测这些基础设施。

这会直接改变后续对记忆系统的评价标准。

以后讨论“这套记忆好不好”，不能只看回答是否更像真人，还要看：

后台任务是否能稳定 reconcile
cron 服务是否可靠
日志是否足够可观察
出故障时能否快速定位

这已经是正经系统能力，不再只是“体验增强”。

六、对使用习惯会带来什么变化

这次更新会改变协作方式，但不会让知识工程直接退休。

可以少手工的部分

1. 偏好和协作习惯

例如：

输出格式偏好
协作节奏
常用项目背景
某些高频约束

这些信息过去经常需要反复提醒，或者手工写进长期记忆文件。以后 Active Memory 更有机会把它们自动带回来。

2. 近期高频碎片

比如最近连续讨论的主题、反复纠正过的错误、某类频繁出现的执行坑，Dreaming 理论上可以把这些信息逐步从会话碎片里提炼出来。

还不能偷懒的部分

1. 强规则和硬边界

像这些东西，依然应该显式写死：

什么目录绝对不能动
什么操作必须确认
什么任务必须走 skill
哪些约束不能依赖系统“自己悟”

Dreaming 再聪明，也不应该替代明确规则。

2. 任务系统

active-tasks、归档记录、日报，这些仍然是执行闭环的一部分。记忆系统负责帮助 recall 和提炼，任务系统负责确保事情真的被做完。两者不能混为一谈。

3. Obsidian wiki 这种上层认知编排

这也是这篇最关键的一个判断。

Active Memory 和 Dreaming 补的是记忆层，但 Obsidian wiki 承担的是更高一级的认知压缩和结构化表达。

wiki 页面不是“记住一件事”，而是把若干事实压缩成可复用的判断结构。比如这次关于 Hermes 的几篇材料，本质上就是现成的认知坐标系。没有这些对照，OpenClaw 这次更新很容易被写成一篇功能说明文。

所以这次变化反而证明了一点：

主动记忆越强，越需要一个上层知识库去承接更高密度的认知结果。

七、如果继续对照 Hermes，下一步真正该补什么

沿着这次升级往后看，OpenClaw 真正值得追的，不再是“有没有记忆”，而是三条更难的链路。

1. 任务后复盘标准化

现在已经有主动召回，也开始有后台整理。下一步最值钱的，是把任务后的结果复盘系统化。

比如：

这次任务成功的关键是什么
失败主要卡在哪一层
哪类修正值得固化为规则
哪类操作应该被提升为 skill 或 policy

2. Dreaming 产物回流执行层

Dreaming 如果只是帮忙“留下东西”，价值还只完成了一半。真正更难、也更关键的，是让它的产物参与未来执行。

例如：

更新 skill 提示
补充 policy 规则
调整默认工作流
给后续任务自动增加防错提醒

3. 让经验真正长成技能

这才是 Hermes 最难被替代的部分。

Hermes 的强，不只是记住偏好，而是经验会逐步长成更稳的行为模式。OpenClaw 如果未来要追平这一段，就必须把“记住”升级成“会改执行”。

八、最终判断

把这次更新和 Obsidian wiki 里关于 Hermes 的既有认知对照起来看，结论已经比较清楚。

这次 OpenClaw 的升级，真正补上的不是表面上的两个功能点，而是两层以前明显偏弱的能力：

回复前主动召回
后台整理与记忆晋升

这让 OpenClaw 从“长期记忆资料库”开始变成“带记忆流动性的执行系统”。这是很实在的一步进展，值得重视。

但如果问题是“它现在是不是已经追上 Hermes”，答案仍然是否定的。

Hermes 最强的地方，依然是那条更完整的闭环：

任务结束后复盘
从复盘里抽取模式
模式回流未来执行
长期演化成 skill 和行为结构

所以，这次更新后的关系可以重新画成一句更准确的话：

OpenClaw 已经开始补上主动记忆层，但 Hermes 真正领先的，仍然是经验回流执行层。

如果继续往前补，下一阶段最关键的，不会是再多几个 memory feature，而是让 Dreaming 和任务复盘、skill 更新、workflow 调整真正接起来。

那一步补上，竞争格局才会真正改写。