2026-04-14 · AI
32
AI · 2026-04-14

OpenClaw 记忆升级之后,和 Hermes 真正还差哪几步

这次 OpenClaw 的更新,真正值得盯的只有两项:

如果只看 release note,这很容易被理解成一次常规功能增强。但把它放回 Obsidian wiki 里已经沉淀下来的那套认知坐标,问题就会变得更准确:

这次更新,到底只是让 OpenClaw 更会记事,还是已经开始逼近 Hermes 那种“越用越长”的能力。

先给结论。

这次更新很重要,因为它第一次把 OpenClaw 的记忆体系,从“手工维护的文档库”往“会主动回忆、会后台整理的系统”推了一大步。但它补上的主要还是记忆中层,还没有补到 Hermes 最强的那一截,也就是任务复盘、经验回流、技能生长那条真正的自进化闭环。

换句话说,这次升级确实让 OpenClaw 更像一个长期工作的 Agent 了,但还没有从执行型网关变成自进化引擎。

一、为什么这次更新值得认真看

过去 OpenClaw 的长期协作能力并不弱。

它有 MEMORY.mdmemory/*.md、active tasks、daily log、session transcript、memory search,再叠加 Obsidian 这类外部知识库,已经能支撑非常长周期的协作。对工程团队来说,这套体系甚至有两个很强的优点。

1. 可审计

记忆写在哪里,何时新增,为什么存在,几乎都能通过文件和日志定位。这对个人折腾可能只是“方便”,但对团队和长期维护来说,这其实是很硬的资产。

2. 工程化

OpenClaw 的长期记忆,本质上一直是“Markdown 文件 + 检索 + 工作流”。它没有把一切都塞进模型黑箱,而是把规则、偏好、任务状态、教训、日志外部化。这种做法不性感,但非常稳。

问题也正出在这里。

3. 旧体系更像资料库,不像工作脑

过去这套记忆机制的最大短板,不是“记不住”,而是:

所以在更新前,OpenClaw 的记忆更像一本整理得不错的工程手册。资料很多,结构也清楚,但它更像被动资产,不像会代谢、会整理、会预取的工作脑。

这就是这次更新真正有意义的背景。

二、这次更新,补的到底是哪两层

从工程视角看,Active Memory 和 Dreaming 分别补的是两层完全不同的能力。

能力
补的层级
解决的问题

Active Memory
回复前主动召回
系统知道旧信息,但未必每轮都想得起来

Dreaming / REM
离线整理与记忆晋升
近期碎片很多,但缺乏自动筛选和提炼

1. Active Memory 补的是“回复前预取”

这件事的关键,不在于“能不能搜到旧信息”,而在于系统会不会默认先想一遍

过去的链路更像这样:

  1. 用户说过很多事情
  2. 会话和 memory 文件把信息存下来了
  3. 后面如果人工维护得好,或者 recall 恰好命中,模型才能把它带回来

现在的链路则变成:

  1. 用户说过很多事情
  2. 在正式回复前,Active Memory 先跑一遍主动记忆过程
  3. 相关偏好、背景、最近约束被优先拉回当前上下文
  4. 模型基于这些内容再输出回答

这个变化看起来像“体验优化”,但本质上是系统行为变了。

OpenClaw 过去更像“档案在那儿,查不查看运气”。现在开始变成“先替当前回答预热上下文”。这一步把记忆从被动查档推进到了主动预取

2. Dreaming 补的是“碎片整理和记忆晋升”

Dreaming 的价值更大,但也更容易被低估。

它不是对话时即时生效的记忆,而是后台整理机制。按照文档描述,它会把近期信息分层处理:

这意味着 OpenClaw 第一次有了一条比较清晰的链路:

短期碎片 → 候选模式 → 评估筛选 → 长期记忆

过去很多有价值的信息,往往散落在这些地方:

以前这些东西要真正沉淀下来,主要靠人工转写。现在 Dreaming 的设计意图,就是先由系统做一轮筛选,再决定哪些东西值得升级为稳定记忆。

这件事一旦跑稳,OpenClaw 的记忆就不再只是“文件多”,而开始变成“信息会流动”。

三、放到 Obsidian wiki 的坐标里,这次变化该怎么看

如果脱离原有认知框架,文章很容易写成“OpenClaw 新增了两个功能”。这种写法信息量太低。

真正更有价值的,是拿已经在 Obsidian wiki 里沉淀过的 Hermes 认知来当尺子重新测量。

wiki 里关于 Hermes 的几条判断一直很稳定:

  1. Hermes 的关键优势,不只是有记忆,而是记忆会参与下一次行为
  2. Hermes 的任务完成后会复盘,并尝试抽取可复用结构
  3. Hermes 的真正卖点不是“配置完能跑”,而是“用久了会长”

沿着这三条线看,OpenClaw 这次更新确实补上了 Hermes 方向里的两步。

第一步,补上了“先想起来再做事”

Active Memory 让 OpenClaw 从“记忆可检索”推进到“记忆可预取”。

这件事对真实使用的影响非常直接。很多时候,用户最烦的不是 Agent 完全不知道,而是它明明知道,就是这一轮没想起来。Active Memory 要解决的就是这个问题。

第二步,补上了“先整理再决定留不留”

Dreaming 则开始让系统有能力处理近期碎片,判断哪些是噪音,哪些值得被提升权重,哪些应该进入长期层。

这一步非常接近 Hermes 叙事里“经验会沉淀”的方向。虽然还没到同样的完成度,但方向已经明显重合。

所以更准确的说法是:

这次更新,不是给 OpenClaw 补了几条记忆功能,而是第一次给它补上了主动回忆层和后台整理层。

四、差距到底缩小了多少

这里最容易出现误判。

很多人会天然把问题理解成:OpenClaw 既然有 Active Memory,又有 Dreaming,那和 Hermes 还差什么?

差很多,但差距的性质已经变了。

已经明显缩小的,是“主动性差距”

过去 Hermes 最强的一种体感,是它的经验好像会自然长出来。现在 OpenClaw 至少已经开始具备两件事:

这说明它已经不再只是静态资料库,而开始具备“记忆流程化”的特征。

还没有补齐的,是“经验回流执行”

Hermes 的核心优势,从来不只是记住更多,而是记住之后会改动作。

这套闭环大致可以拆成四步:

  1. 完成任务
  2. 对结果做复盘
  3. 从复盘里抽出规则、模式、偏好或新 skill
  4. 下一次执行时,优先调用这些新长出来的结构

OpenClaw 这次补的是前两步的外围能力,尤其是“信息想得起来”和“碎片能整理”。但它还没有天然打通下面这条最关键的链:

记忆筛选结果 → 规则更新 / skill 优化 / workflow 调整 → 未来执行行为变化

而这条链,恰好就是 Hermes 最有辨识度的地方。

所以从工程判断上,更准确的结论应该是:

OpenClaw 现在已经开始长出记忆流动性,但还没长出稳定的经验回流闭环。

五、这次实操里暴露出的坑,比宣传页更有价值

如果只写理念,会很空。真正有价值的判断,应该建立在这次实际落地过程中踩到的坑上。

1. 新能力不是默认自动生效

这次最大的第一个误区,就是看到文档更新,就以为能力已经自动在运行。

实际不是。

也就是说,版本升级只代表“代码里有这个能力”,不代表“当前环境已经在用”。

这件事非常工程化,也非常重要。因为它直接决定了后续文章里的判断应该站在哪个层次上:

讨论的是“能力上限被补齐到哪里”,不是“默认安装后就立刻具备了什么”。

2. Active Memory 会带来额外模型调用成本

这次第二个很实在的坑,是 Active Memory 在未显式配模型时,继承到了当前会话模型,结果落到了 openai-codex/gpt-5.4,随后出现超时告警。

这里暴露出的现实问题是:

主动记忆不是免费的,它本身就是一次额外推理。

如果这层推理绑在重模型上,带来的不只是“多花一点钱”,而是更高的延迟和更差的稳定性。最后真正被拖垮的,是主会话体验。

所以这次落地里,把它显式改成:

这个动作非常关键,因为它把“概念能跑”拉回了“生产可用”。

3. Dreaming 开启后,开始真正依赖后台服务状态

这次还遇到一条 warning:

memory-core: managed dreaming cron could not be reconciled (cron service unavailable)

后来结合 openclaw status 看,基本可以判断是重启瞬间的时序问题,不是 dreaming 本身坏了。

但这件事的价值,在于它提醒了一点:

记忆一旦后台化,它就不再只是 prompt 层的技巧,而是开始依赖 cron、task service、状态同步、日志观测这些基础设施。

这会直接改变后续对记忆系统的评价标准。

以后讨论“这套记忆好不好”,不能只看回答是否更像真人,还要看:

这已经是正经系统能力,不再只是“体验增强”。

六、对使用习惯会带来什么变化

这次更新会改变协作方式,但不会让知识工程直接退休。

可以少手工的部分

1. 偏好和协作习惯

例如:

这些信息过去经常需要反复提醒,或者手工写进长期记忆文件。以后 Active Memory 更有机会把它们自动带回来。

2. 近期高频碎片

比如最近连续讨论的主题、反复纠正过的错误、某类频繁出现的执行坑,Dreaming 理论上可以把这些信息逐步从会话碎片里提炼出来。

还不能偷懒的部分

1. 强规则和硬边界

像这些东西,依然应该显式写死:

Dreaming 再聪明,也不应该替代明确规则。

2. 任务系统

active-tasks、归档记录、日报,这些仍然是执行闭环的一部分。记忆系统负责帮助 recall 和提炼,任务系统负责确保事情真的被做完。两者不能混为一谈。

3. Obsidian wiki 这种上层认知编排

这也是这篇最关键的一个判断。

Active Memory 和 Dreaming 补的是记忆层,但 Obsidian wiki 承担的是更高一级的认知压缩和结构化表达。

wiki 页面不是“记住一件事”,而是把若干事实压缩成可复用的判断结构。比如这次关于 Hermes 的几篇材料,本质上就是现成的认知坐标系。没有这些对照,OpenClaw 这次更新很容易被写成一篇功能说明文。

所以这次变化反而证明了一点:

主动记忆越强,越需要一个上层知识库去承接更高密度的认知结果。

七、如果继续对照 Hermes,下一步真正该补什么

沿着这次升级往后看,OpenClaw 真正值得追的,不再是“有没有记忆”,而是三条更难的链路。

1. 任务后复盘标准化

现在已经有主动召回,也开始有后台整理。下一步最值钱的,是把任务后的结果复盘系统化。

比如:

2. Dreaming 产物回流执行层

Dreaming 如果只是帮忙“留下东西”,价值还只完成了一半。真正更难、也更关键的,是让它的产物参与未来执行。

例如:

3. 让经验真正长成技能

这才是 Hermes 最难被替代的部分。

Hermes 的强,不只是记住偏好,而是经验会逐步长成更稳的行为模式。OpenClaw 如果未来要追平这一段,就必须把“记住”升级成“会改执行”。

八、最终判断

把这次更新和 Obsidian wiki 里关于 Hermes 的既有认知对照起来看,结论已经比较清楚。

这次 OpenClaw 的升级,真正补上的不是表面上的两个功能点,而是两层以前明显偏弱的能力:

  1. 回复前主动召回
  2. 后台整理与记忆晋升

这让 OpenClaw 从“长期记忆资料库”开始变成“带记忆流动性的执行系统”。这是很实在的一步进展,值得重视。

但如果问题是“它现在是不是已经追上 Hermes”,答案仍然是否定的。

Hermes 最强的地方,依然是那条更完整的闭环:

所以,这次更新后的关系可以重新画成一句更准确的话:

OpenClaw 已经开始补上主动记忆层,但 Hermes 真正领先的,仍然是经验回流执行层。

如果继续往前补,下一阶段最关键的,不会是再多几个 memory feature,而是让 Dreaming 和任务复盘、skill 更新、workflow 调整真正接起来。

那一步补上,竞争格局才会真正改写。

目录 最新
← 左侧翻上一屏 · 右侧翻下一屏 · 中间唤出菜单