2026-03-09 · 架构
32
架构 · 2026-03-09

当你决定养一只龙虾:OpenClaw的技术骨架、安全边界与长期维护成本

读完这个目录里所有关于 OpenClaw 的文章后,我发现一个很有意思的现象。

前期热度文章里,很多人把重点放在“它能干什么”“多快能装起来”“怎么用起来最爽”。真正开始谈技术骨架、安全边界、长期维护成本的内容,大多出现在热度中后段,或者干脆出现在反思稿里。

这个顺序很容易让人误解。

大家会先听到“AI 员工”“龙虾军团”“24/7 自动化”,然后才会慢慢意识到,这套系统背后有一个完整的工程世界。这个世界里有网关、有消息通道、有模型选择、有权限设计、有 prompt 分层、有多 agent 协作、有定时任务、有日志、有崩溃恢复、有成本控制。

更关键的是,这个世界里还有很多不性感,但很致命的问题:

这篇文章我不想重复“它有多好用”。这种话已经很多人说过了。我想聊的是更现实、更少被公开讨论,但对你做长期决策影响更大的三个问题:

从九层 Prompt 到单 Gateway 多 Agent:OpenClaw 的技术骨架长什么样

很多人第一次接触 OpenClaw,会觉得它像个会聊天的小龙虾。可一旦你开始认真配置、扩展、甚至做多 agent 协作,你很快会发现,自己面对的是一整个系统。

这个系统大概长这样。

一,九层 System Prompt 架构:LLM 的输入远不止你一句话

huangserva 那篇《OpenClaw Agent System Prompt 架构详解(9 层)》把这件事讲得很透。

你每次跟 OpenClaw 说一句话,它真正发给模型的输入至少包含九层内容:

很多人没意识到一件事:你说的“帮我查资料”“整理日报”“跟进客户”,在整个输入里只占最后一小部分。真正决定它怎么理解、怎么执行、怎么输出风格的,是前面八层内容长期累积的结果。

这解释了为什么同一个模型、同一句话,在不同 agent、不同配置、不同历史上下文下,反应会完全不同。也解释了为什么你一旦开始认真调教,时间往往会花在配置文件、记忆管理、prompt 调优、技能编排上,而不是单次对话。

九层架构不是玄学,它是工程现实。你越早理解这件事,越少会对“怎么它有时候突然变傻了”感到惊讶。

二,单 Gateway 多 Agent:不是多开几个 bot,而是操作系统级协作

余温那篇《我用 OpenClaw 搭了一套 5 角色 AI 协作操作系统》,很多人会看成“多开几个 bot 各干各的”。可他实际搭建的是另一套结构:

这套架构的价值不在“多”,而在“可控”。

每个 Agent 清楚自己能干什么、不能干什么。系统清楚遇到什么情况该找哪个 Agent。协作不是靠“大家聊一聊”,而是靠预定义的规则和路由。

当你开始认真搭多 Agent 协作,你就已经从“玩一个 bot”进到了“设计一个小系统”。

三,Workspace 文件体系:每个 Agent 的独立办公室

每个 Agent 有自己独立的工作区,里面至少会包含:

这些文件不是装饰。它们是 agent 的“大脑配置”。你每改一行,它的行为可能就会偏移一点点。长期使用的话,你会花大量时间在这套文件体系上做微调。

很多人第一次装完 OpenClaw,会忽略这一层。可一旦你开始认真用,你会发现,这套文件体系才是你和 agent 真正对话的地方。

这套系统的边界和风险在哪里

OpenClaw 的诱惑力很强,因为它能干的事情很多。可从安全和风险角度看,你最好在一开始就搞清楚几条边界。

一,权限边界:能碰不等于该碰

目录里有不少文章提到,OpenClaw 可以读写文件、执行命令、操作浏览器、调用第三方 API、发邮件、发消息、改代码、改配置。这些能力单个看都很美,合在一起就是一个需要严肃对待的权限集合。

很多人第一次玩,会觉得“把权限开大点,它就更自由”。可问题出在另一面:

更现实一点的策略是:

二,自治边界:能自治不等于该长期自治

那篇《烧了二十亿 token 之后》提到的几个场景很值得玩味。

第一个场景,他希望 OpenClaw 自己完成飞书文档同步功能。结果系统一通操作,代码仓库多了十几坨不敢看的 diff,链接还是 404。

第二个场景,多 agent 在群里深夜狂刷屏,最后只能手动全清。

这些场景的共同点很简单:自治一旦没有边界,很容易跑偏。

更稳的做法是:

三,通道边界:连得越多,追踪成本越高

OpenClaw 支持 Telegram、WhatsApp、Discord、Slack、飞书等多种通道。很多人会觉得“都连上更方便”。可问题在于,通道越多,你就越难回答“它刚才到底干了什么”。

更实际的策略是:

四,记忆和上下文边界:记得越多,越容易混乱

长期记忆是 OpenClaw 的一大卖点。它确实能跨会话记住你的偏好、习惯、项目状态。可记忆越多,上下文管理就越复杂。

几个常见问题:

更稳的做法是:

长期维护成本往往被前期文章低估

OpenClaw 的安装成本,很多文章已经讲得很清楚。可长期维护成本,往往被淡化。如果你真打算长期养,最好提前知道这些事。

一,模型成本比你想的更复杂

很多人第一次算账,会只看“每次对话多少钱”。可真实成本结构往往更复杂:

目录里 Star 那篇长文提到“分层模型”和“API 聚合路由”,就是在解决这个问题。他会把简单任务交给便宜模型,只把真正难的判断交给强模型。这比“全程用最强模型”省钱太多。

二,维护和调试成本比你想的更高

OpenClaw 不是一个“装完就不管”的工具。你真正用起来,会发现很多时间花在:

很多人觉得这些是“一次性麻烦”。可长期看,这套系统像一台需要定期保养的机器。你越依赖它,越需要有人持续维护。

三,技能和依赖生态比你想的更脆弱

OpenClaw 的强大很大程度来自技能生态。可技能本质上是社区贡献的第三方代码。

几个现实问题:

更稳的策略是:

四,心智负担比你想的更重

很多人以为 OpenClaw 能“解放脑力”。可长期使用,你会发现它在另一个层面增加了心智负担:

这些都不是难到无法解决的问题。它们更像是一种“系统维护税”。你越依赖这套系统,越需要有人持续交这笔税。

如果你真的打算长期养,最好怎么开始

看完这批文章后,我对 OpenClaw 的态度很明确:它是一个很强大的个人自动化外壳,值得认真用,不值得盲目迷信。

如果你真的打算长期用,我建议按下面这个顺序来。

第一步,先用最小权限跑通一个小任务

不要一上来就让它“帮我搞定整个业务流程”。先选一个规则清晰、风险可控、容易验证的小任务。比如:

这一步的目标不是炫技,而是建立信任回路。你需要先确认系统在简单任务上不疯、不乱、不跑偏,再考虑让它做更复杂的事。

第二步,把权限和边界想清楚再放大

一旦小任务跑通,你会很容易想“再开点权限,让它多干点”。这个时刻非常关键。

最好在这一步先问自己几个问题:

高风险动作一律人工确认,低成本、可回滚的动作再考虑自治。

第三步,为每个角色建独立工作区,不要混着用

你如果打算做多 agent 协作,最好一开始就为每个角色建独立工作区。

每个角色有自己的 IDENTITY、SOUL、MEMORY、skills。不要让一个 agent 什么都干,否则你的系统很快会变得不可追踪。

第四步,建立日志和监控习惯,不要等出事再查

OpenClaw 不是黑盒。它有日志、有状态、有可追溯的记录。你最好从一开始就养成定期查看的习惯:

这些动作花不了多少时间,能替你省下大量事后救火成本。

第五步,定期“体检”,不要等系统自己告诉你问题

就像人会需要体检,系统也一样。你最好每隔一段时间做一次完整检查:

系统不会主动告诉你“我有点不对劲”。它通常会在出大事的那一刻才会让你意识到问题早就存在。

我对 OpenClaw 长期价值的最终判断

看完整个目录后,我对 OpenClaw 的判断越来越清晰。

它不是神话。

它也不是骗术。

它是一个工程现实。

在工程现实里,任何工具都有代价,都有边界,都需要维护。OpenClaw 的特殊之处在于,它把很多以前分散在脚本、自动化工具、浏览器扩展、定时任务、提醒系统里的能力,重新打包成了一个更统一、更可编排、更易扩展的外壳。

这个外壳很有价值。

它尤其适合那些愿意自己设计工作流、愿意长期打磨配置、愿意在自动化和人工确认之间找平衡的人。

它不太适合那些希望“一句话甩手”的人。

也不太适合那些愿意把所有权限、所有判断、所有执行都外包给系统的人。

更不适合那些完全不想理解系统,只想享受红利的人。

OpenClaw 最值得用的地方,不在于它像人,而在于它能帮你把重复、流程化、规则明确的部分吃掉,把你从机械劳动里解放出来,让你把精力花在真正需要判断的地方。

当你理解了这一点,你就不会再被“全自动 AI 员工”“睡后自动赚钱”这些话带偏。

你会更在意:

这些事没那么性感。

可它们才决定了一个系统能不能真正活过第一波兴奋期。

本文主要参考材料

目录 最新
← 左侧翻上一屏 · 右侧翻下一屏 · 中间唤出菜单