
这次 OpenClaw 的更新,真正值得盯的只有两项:
- Active Memory,在回复前主动回忆偏好、背景和最近约束
- Dreaming / REM Backfill,在空闲阶段整理碎片信息,筛选哪些值得晋升为长期记忆
如果只看 release note,这很容易被理解成一次常规功能增强。但把它放回 Obsidian wiki 里已经沉淀下来的那套认知坐标,问题就会变得更准确:
这次更新,到底只是让 OpenClaw 更会记事,还是已经开始逼近 Hermes 那种“越用越长”的能力。
先给结论。
这次更新很重要,因为它第一次把 OpenClaw 的记忆体系,从“手工维护的文档库”往“会主动回忆、会后台整理的系统”推了一大步。但它补上的主要还是记忆中层,还没有补到 Hermes 最强的那一截,也就是任务复盘、经验回流、技能生长那条真正的自进化闭环。
换句话说,这次升级确实让 OpenClaw 更像一个长期工作的 Agent 了,但还没有从执行型网关变成自进化引擎。
一、为什么这次更新值得认真看
过去 OpenClaw 的长期协作能力并不弱。
它有 MEMORY.md、memory/*.md、active tasks、daily log、session transcript、memory search,再叠加 Obsidian 这类外部知识库,已经能支撑非常长周期的协作。对工程团队来说,这套体系甚至有两个很强的优点。
1. 可审计
记忆写在哪里,何时新增,为什么存在,几乎都能通过文件和日志定位。这对个人折腾可能只是“方便”,但对团队和长期维护来说,这其实是很硬的资产。
2. 工程化
OpenClaw 的长期记忆,本质上一直是“Markdown 文件 + 检索 + 工作流”。它没有把一切都塞进模型黑箱,而是把规则、偏好、任务状态、教训、日志外部化。这种做法不性感,但非常稳。
问题也正出在这里。
3. 旧体系更像资料库,不像工作脑
过去这套记忆机制的最大短板,不是“记不住”,而是:
- 很多高价值信息,需要人工明确写进
MEMORY.md或memory/ - 系统能搜到,不代表会主动想起
- 能存下来,不代表会自动筛选和晋升
所以在更新前,OpenClaw 的记忆更像一本整理得不错的工程手册。资料很多,结构也清楚,但它更像被动资产,不像会代谢、会整理、会预取的工作脑。
这就是这次更新真正有意义的背景。
二、这次更新,补的到底是哪两层
从工程视角看,Active Memory 和 Dreaming 分别补的是两层完全不同的能力。
能力
补的层级
解决的问题
Active Memory
回复前主动召回
系统知道旧信息,但未必每轮都想得起来
Dreaming / REM
离线整理与记忆晋升
近期碎片很多,但缺乏自动筛选和提炼
1. Active Memory 补的是“回复前预取”
这件事的关键,不在于“能不能搜到旧信息”,而在于系统会不会默认先想一遍。
过去的链路更像这样:
- 用户说过很多事情
- 会话和 memory 文件把信息存下来了
- 后面如果人工维护得好,或者 recall 恰好命中,模型才能把它带回来
现在的链路则变成:
- 用户说过很多事情
- 在正式回复前,Active Memory 先跑一遍主动记忆过程
- 相关偏好、背景、最近约束被优先拉回当前上下文
- 模型基于这些内容再输出回答
这个变化看起来像“体验优化”,但本质上是系统行为变了。
OpenClaw 过去更像“档案在那儿,查不查看运气”。现在开始变成“先替当前回答预热上下文”。这一步把记忆从被动查档推进到了主动预取。
2. Dreaming 补的是“碎片整理和记忆晋升”
Dreaming 的价值更大,但也更容易被低估。
它不是对话时即时生效的记忆,而是后台整理机制。按照文档描述,它会把近期信息分层处理:
- Light:整理、去重、暂存
- REM:抽取主题,提炼近期高频模式
- Deep:对候选信息打分,决定是否进入长期记忆
这意味着 OpenClaw 第一次有了一条比较清晰的链路:
短期碎片 → 候选模式 → 评估筛选 → 长期记忆
过去很多有价值的信息,往往散落在这些地方:
- 某天日志里的一段纠正
- 一次执行失败后的复盘
- 某条偏好说明
- 若干轮会话里反复出现的约束
- 一个只在当下看起来很小、之后会反复出现的坑
以前这些东西要真正沉淀下来,主要靠人工转写。现在 Dreaming 的设计意图,就是先由系统做一轮筛选,再决定哪些东西值得升级为稳定记忆。
这件事一旦跑稳,OpenClaw 的记忆就不再只是“文件多”,而开始变成“信息会流动”。
三、放到 Obsidian wiki 的坐标里,这次变化该怎么看
如果脱离原有认知框架,文章很容易写成“OpenClaw 新增了两个功能”。这种写法信息量太低。
真正更有价值的,是拿已经在 Obsidian wiki 里沉淀过的 Hermes 认知来当尺子重新测量。
wiki 里关于 Hermes 的几条判断一直很稳定:
- Hermes 的关键优势,不只是有记忆,而是记忆会参与下一次行为
- Hermes 的任务完成后会复盘,并尝试抽取可复用结构
- Hermes 的真正卖点不是“配置完能跑”,而是“用久了会长”
沿着这三条线看,OpenClaw 这次更新确实补上了 Hermes 方向里的两步。
第一步,补上了“先想起来再做事”
Active Memory 让 OpenClaw 从“记忆可检索”推进到“记忆可预取”。
这件事对真实使用的影响非常直接。很多时候,用户最烦的不是 Agent 完全不知道,而是它明明知道,就是这一轮没想起来。Active Memory 要解决的就是这个问题。
第二步,补上了“先整理再决定留不留”
Dreaming 则开始让系统有能力处理近期碎片,判断哪些是噪音,哪些值得被提升权重,哪些应该进入长期层。
这一步非常接近 Hermes 叙事里“经验会沉淀”的方向。虽然还没到同样的完成度,但方向已经明显重合。
所以更准确的说法是:
这次更新,不是给 OpenClaw 补了几条记忆功能,而是第一次给它补上了主动回忆层和后台整理层。
四、差距到底缩小了多少
这里最容易出现误判。
很多人会天然把问题理解成:OpenClaw 既然有 Active Memory,又有 Dreaming,那和 Hermes 还差什么?
差很多,但差距的性质已经变了。
已经明显缩小的,是“主动性差距”
过去 Hermes 最强的一种体感,是它的经验好像会自然长出来。现在 OpenClaw 至少已经开始具备两件事:
- 回复前主动把旧信息拉回来
- 后台主动处理近期碎片
这说明它已经不再只是静态资料库,而开始具备“记忆流程化”的特征。
还没有补齐的,是“经验回流执行”
Hermes 的核心优势,从来不只是记住更多,而是记住之后会改动作。
这套闭环大致可以拆成四步:
- 完成任务
- 对结果做复盘
- 从复盘里抽出规则、模式、偏好或新 skill
- 下一次执行时,优先调用这些新长出来的结构
OpenClaw 这次补的是前两步的外围能力,尤其是“信息想得起来”和“碎片能整理”。但它还没有天然打通下面这条最关键的链:
记忆筛选结果 → 规则更新 / skill 优化 / workflow 调整 → 未来执行行为变化
而这条链,恰好就是 Hermes 最有辨识度的地方。
所以从工程判断上,更准确的结论应该是:
OpenClaw 现在已经开始长出记忆流动性,但还没长出稳定的经验回流闭环。
五、这次实操里暴露出的坑,比宣传页更有价值
如果只写理念,会很空。真正有价值的判断,应该建立在这次实际落地过程中踩到的坑上。
1. 新能力不是默认自动生效
这次最大的第一个误区,就是看到文档更新,就以为能力已经自动在运行。
实际不是。
active-memory需要显式启用配置dreaming是 opt-in,默认关闭
也就是说,版本升级只代表“代码里有这个能力”,不代表“当前环境已经在用”。
这件事非常工程化,也非常重要。因为它直接决定了后续文章里的判断应该站在哪个层次上:
讨论的是“能力上限被补齐到哪里”,不是“默认安装后就立刻具备了什么”。
2. Active Memory 会带来额外模型调用成本
这次第二个很实在的坑,是 Active Memory 在未显式配模型时,继承到了当前会话模型,结果落到了 openai-codex/gpt-5.4,随后出现超时告警。
这里暴露出的现实问题是:
主动记忆不是免费的,它本身就是一次额外推理。
如果这层推理绑在重模型上,带来的不只是“多花一点钱”,而是更高的延迟和更差的稳定性。最后真正被拖垮的,是主会话体验。
所以这次落地里,把它显式改成:
model: zai/glm-5-turbotimeoutMs: 8000
这个动作非常关键,因为它把“概念能跑”拉回了“生产可用”。
3. Dreaming 开启后,开始真正依赖后台服务状态
这次还遇到一条 warning:
memory-core: managed dreaming cron could not be reconciled (cron service unavailable)
后来结合 openclaw status 看,基本可以判断是重启瞬间的时序问题,不是 dreaming 本身坏了。
但这件事的价值,在于它提醒了一点:
记忆一旦后台化,它就不再只是 prompt 层的技巧,而是开始依赖 cron、task service、状态同步、日志观测这些基础设施。
这会直接改变后续对记忆系统的评价标准。
以后讨论“这套记忆好不好”,不能只看回答是否更像真人,还要看:
- 后台任务是否能稳定 reconcile
- cron 服务是否可靠
- 日志是否足够可观察
- 出故障时能否快速定位
这已经是正经系统能力,不再只是“体验增强”。
六、对使用习惯会带来什么变化
这次更新会改变协作方式,但不会让知识工程直接退休。
可以少手工的部分
1. 偏好和协作习惯
例如:
- 输出格式偏好
- 协作节奏
- 常用项目背景
- 某些高频约束
这些信息过去经常需要反复提醒,或者手工写进长期记忆文件。以后 Active Memory 更有机会把它们自动带回来。
2. 近期高频碎片
比如最近连续讨论的主题、反复纠正过的错误、某类频繁出现的执行坑,Dreaming 理论上可以把这些信息逐步从会话碎片里提炼出来。
还不能偷懒的部分
1. 强规则和硬边界
像这些东西,依然应该显式写死:
- 什么目录绝对不能动
- 什么操作必须确认
- 什么任务必须走 skill
- 哪些约束不能依赖系统“自己悟”
Dreaming 再聪明,也不应该替代明确规则。
2. 任务系统
active-tasks、归档记录、日报,这些仍然是执行闭环的一部分。记忆系统负责帮助 recall 和提炼,任务系统负责确保事情真的被做完。两者不能混为一谈。
3. Obsidian wiki 这种上层认知编排
这也是这篇最关键的一个判断。
Active Memory 和 Dreaming 补的是记忆层,但 Obsidian wiki 承担的是更高一级的认知压缩和结构化表达。
wiki 页面不是“记住一件事”,而是把若干事实压缩成可复用的判断结构。比如这次关于 Hermes 的几篇材料,本质上就是现成的认知坐标系。没有这些对照,OpenClaw 这次更新很容易被写成一篇功能说明文。
所以这次变化反而证明了一点:
主动记忆越强,越需要一个上层知识库去承接更高密度的认知结果。
七、如果继续对照 Hermes,下一步真正该补什么
沿着这次升级往后看,OpenClaw 真正值得追的,不再是“有没有记忆”,而是三条更难的链路。
1. 任务后复盘标准化
现在已经有主动召回,也开始有后台整理。下一步最值钱的,是把任务后的结果复盘系统化。
比如:
- 这次任务成功的关键是什么
- 失败主要卡在哪一层
- 哪类修正值得固化为规则
- 哪类操作应该被提升为 skill 或 policy
2. Dreaming 产物回流执行层
Dreaming 如果只是帮忙“留下东西”,价值还只完成了一半。真正更难、也更关键的,是让它的产物参与未来执行。
例如:
- 更新 skill 提示
- 补充 policy 规则
- 调整默认工作流
- 给后续任务自动增加防错提醒
3. 让经验真正长成技能
这才是 Hermes 最难被替代的部分。
Hermes 的强,不只是记住偏好,而是经验会逐步长成更稳的行为模式。OpenClaw 如果未来要追平这一段,就必须把“记住”升级成“会改执行”。
八、最终判断
把这次更新和 Obsidian wiki 里关于 Hermes 的既有认知对照起来看,结论已经比较清楚。
这次 OpenClaw 的升级,真正补上的不是表面上的两个功能点,而是两层以前明显偏弱的能力:
- 回复前主动召回
- 后台整理与记忆晋升
这让 OpenClaw 从“长期记忆资料库”开始变成“带记忆流动性的执行系统”。这是很实在的一步进展,值得重视。
但如果问题是“它现在是不是已经追上 Hermes”,答案仍然是否定的。
Hermes 最强的地方,依然是那条更完整的闭环:
- 任务结束后复盘
- 从复盘里抽取模式
- 模式回流未来执行
- 长期演化成 skill 和行为结构
所以,这次更新后的关系可以重新画成一句更准确的话:
OpenClaw 已经开始补上主动记忆层,但 Hermes 真正领先的,仍然是经验回流执行层。
如果继续往前补,下一阶段最关键的,不会是再多几个 memory feature,而是让 Dreaming 和任务复盘、skill 更新、workflow 调整真正接起来。
那一步补上,竞争格局才会真正改写。