2026-04-27 · 架构
32
架构 · 2026-04-27

罗福莉谈 OpenClaw 与 Agent 框架冲击:为什么这不是“Claude Code 加个 IM”那么简单

视频来源:https://youtu.be/V9eI-t3TApE?si=8_GpGXH_MSAJGyhv

受访者:罗福莉(小米大模型负责人)

说明:本文基于用户提供的中文字幕转写整理,按一个核心问题重新组织,不是逐字稿。

很多人第一次看 OpenClaw,都会下一个很快的判断:这不就是 Claude Code 外面再套一个 IM、一个 UI、几个定时任务吗?

这个判断不算错,但只看到了最表面那层。罗福莉这次访谈最有价值的地方,在于她把自己的认知转变讲得很完整。她一开始也排斥 OpenClaw,觉得它偏产品、偏运营,甚至有点“玄学”。可真正上手三天之后,她得出的结论已经完全变了:OpenClaw 干的不是给模型套一个更好看的交互壳,它是在用一整套精细编排的 Agent 框架,补模型在真实任务里的短板。

这句话很关键。因为如果只把它当聊天工具,后面关于记忆、多模型调度、Skills、心跳任务、群聊协作、自进化这些能力,看上去都像附属功能。换个角度,把它理解成“模型和任务之间的中间操作层”,很多原来看着不酷的小设计,分量一下就出来了。

这篇文章只想说清一个问题:OpenClaw 带来的冲击,已经不在产品小改良这个层面了,它碰到的是 Agent 框架层的范式变化。

一、她最开始为什么排斥 OpenClaw

这一段特别真实。

罗福莉一开始的认知,其实和很多严肃做编码、做模型的人差不多:Claude Code 已经很好了,如果 OpenClaw 只是“Claude Code 加 IM”,那它更像一种交互产品,不像一个真正重要的技术框架。再加上它早期社区里一些比较偏运营、偏氛围感的东西,很容易让技术背景比较强的人产生一种天然抵触。

这个抵触并不奇怪。因为过去两年,围绕 Agent 的讨论里,确实有太多东西停留在演示层和概念层。一个能拉群、能发消息、能定时提醒的东西,不自动等于它在技术范式上有突破。

所以她一开始的怀疑很合理。更有意思的是,她后面为什么会被它说服。

二、认知转折点,不在“它更会聊天”,在于 context 编排得够细

她提到第一次认真装上 OpenClaw,是春节深夜。凌晨两点装好,一聊聊到六点。这个细节其实不重要,重要的是她后面总结出的原因。

很多人第一次被 OpenClaw 打动,会说它有温度、有自主性、有灵魂。比如会提醒你太晚了该睡觉,会显得比普通聊天机器人更像一个在跟你长期相处的对象。

但如果只停在这个层面,理解还是浅了。

她真正后面去深究时发现,这种“像有灵魂”不是凭空来的,而是由一堆非常细微的 context engineering 堆出来的。比如时间感知,比如每轮上下文前面怎么拼当前时间,比如不同层级的记忆和规则文件怎么被注入,比如搜索、任务、记忆这些东西怎么分层。

这也是她为什么会用“精细编排的 context”来形容 OpenClaw。

这件事的技术含义也很明确。

它没有把所有希望都压在模型本体上,而是在模型前后搭了一整套中间系统,让它更像一个会做事的人。单个点拎出来看,很多都不算酷,甚至有点 boring。可这些东西一旦组合起来,模型的表现就像被重新点亮了一样。

这和很多人对 Agent 的直觉不太一样。很多人理解的 Agent,无非是“更强的提示词 + 更多工具”。OpenClaw 走的路线更像是:把模型放进一套更接近真实工作环境的操作系统里。

三、真正的震撼发生在第二天和第三天

如果第一天只是觉得它“有灵魂”,那还不足以改变一个技术研究者的判断。

真正让她认知翻转的,是第二天和第三天。

第二天,她开始把生活和团队管理里那些自己原本认为框架做不成的事交给它做,比如怎么激发团队好奇心,怎么筛选具备好奇心的人,怎么讨论组织结构和团队构建。她的描述很直接,OpenClaw 不只是能聊,而且能把这种很抽象、很依赖经验的东西组织成一套体系化的输出,最后甚至能沉淀成 Skills。

第三天,她开始把研究任务交给它做。这里的代表例子是 User Agent。她本来以为这是一个至少不该在一两个小时内做出来的研究 topic,结果在持续讨论后,一个可用的 User Agent 雏形很快就出来了,而且已经足够支持后续 Agent 场景数据构造、SFT 和 RL 训练。

这三天其实就是三层冲击:

  1. 产品体验像一个有温度的对象。
  2. 工作协作像一个能沉淀经验的数字分身。
  3. 研究推进像一个能参与问题构造和方案落地的合作者。

如果只是第一层,那它确实只是一个更会聊天的产品。如果三层都成立,那它就是一个新的工作界面。

四、OpenClaw 相比 Claude Code,到底强在哪

罗福莉这段讲得很克制,她反复说,把每个点单独拎出来讲,其实都有点 boring。这个判断很准。

因为 OpenClaw 真正的优势,不在于某一个点前无古人,而在于它把很多看似琐碎的小设计整合成了一个完成度很高的系统。

她提到几个点最关键。

1. 记忆是分层的

她在用 Claude Code 时,没有明显感受到这种分层记忆体系。OpenClaw 则更像是把 memory 当成一个正式系统来设计,而不是一个 session 临时补丁。

这会直接影响长期任务、跨会话复用、团队经验沉淀这些事情的上限。

2. 多模型调度是默认能力

她举了一个很能说明问题的例子。使用 Claude Code 时,如果某个模型视频理解差,你会本能地想,得自己再给它配一个更适合看视频的模型。而在 OpenClaw 里,她不需要先想这件事,她直接把视频发过去,框架会自己想办法找更合适的模型来处理。

关键不在“能调模型”,关键在于框架会主动替你补模型短板。这其实就是它很核心的一条设计哲学。

它默认承认,当代模型都不完美。所以框架不该把模型的限制原样甩给用户,中间层就得主动做补偿。

3. 框架是可改的

Claude Code 再强,终究是黑盒。你可以用它,但你很难从底层改它的记忆系统、Agent workflow 或多 Agent 结构。

OpenClaw 开源带来的最大价值,不止是“能看源码”。更重要的是,你真能把它当实验底盘,按自己的需求重构 Agent 框架。

她自己就做了很多这种事情,包括让它帮忙设计新的 memory system,改 multi-agent 逻辑,调整整个 Agent 架构。这种原生可操纵性,对真正做研究和做框架的人来说,冲击感会非常大。

这也是为什么她会说,OpenClaw 不是只释放了 Claude Opus 4.6 的能力,它还释放了人去改造框架本身的创造力。

五、为什么开源 Agent 框架的价值比看起来大得多

这段其实是整场访谈里我最认同的部分之一。

很多人会把“开源”理解成一种分发方式,或者一种社区姿态。但放在 Agent 框架这件事上,开源本身就是能力边界的一部分。

原因很简单。闭源框架再强,你看到的也是结果,不是机制。你不能真正理解它怎么做了 memory、怎么做 multi-agent、怎么做 task orchestration,也就很难让更多人的智慧共同改它。

OpenClaw 在国内会形成这么强的集体探索氛围,本质原因就在这里。大家不只是用它,还能一起改它、一起加 Skills、一起调整 workflow、一起让它更贴近自己的场景。

这会带来一个很恐怖的飞轮:

这就是为什么她会说,OpenClaw 的真正价值是让群体智慧开始参与 Agent 框架演化。

从这个角度看,它更像一个正在长出来的开源操作层,而不是一个已经定型的产品。

六、为什么这件事在中国会更热

她给出的判断很有意思。

第一,中国开发者对效率提升的需求更急迫。第二,国内有大量便宜好用的中层模型可用,而 OpenClaw 恰好非常擅长把这些中层模型在复杂框架里“抬高”,让它们在绝大多数生活和工作场景里发挥出超出预期的完成度。

这点非常关键。

如果你每次都得靠最贵的顶尖模型,使用成本和心理门槛都会很高。但如果你发现,一个中层模型接上这套 Agent 框架之后,已经能替你完成大量真实任务,而且价格还很便宜,那你就会非常有动力去持续使用、持续优化。

所以 OpenClaw 在国内的爆发,不只是社区宣传问题,更是成本结构和使用习惯共同决定的。

七、真正该记住的,是 Agent 框架已经成了独立变量

如果把这场访谈拉回技术判断层,我觉得最值得记住的一句话是:Agent 框架本身,已经成了决定模型表现上限的独立变量。

以前大家讨论模型能力,默认主语是模型。后来大家开始接受,prompt 和 tool use 也能改变表现。现在再往前一步,越来越多人开始意识到,memory、message channels、task orchestration、multi-agent、skills、context layering 这些东西一起构成的 Agent 框架,本身就在重新定义任务完成率。

这意味着什么?

意味着未来模型公司的竞争,不只是预训练和后训练的竞争,也会变成“谁更懂怎么设计一套能把模型短板补掉的操作层”。

OpenClaw 在 2026 年先做出来的,也不是一个完美产品,更像是一个足够开放、足够可改、能激发人创造欲的起点。

结尾

我觉得这次访谈最有意思的一层,在于她把一种很典型的技术人认知变化路径讲清楚了。

先怀疑,后试用,再上头,接着拆机制,最后把它当成一个可塑形的研究底盘。

这条路径说明了一件事:真正重要的框架,往往不是一开始看起来最酷的东西。很多时候,它甚至会因为太产品、太开放、太杂而被低估。可一旦有人真的拿它去完成生活任务、研究任务、团队协作任务,它的价值就会从“交互创新”变成“工作范式变化”。

如果只把 OpenClaw 看成 Claude Code 加了个 IM,那你看到的只是表面。

如果把它看成一套在系统层面弥补模型短板、放大群体智慧、允许人和 Agent 共创进化的框架,那这件事才真正开始有意思起来。

目录 最新
← 左侧翻上一屏 · 右侧翻下一屏 · 中间唤出菜单