
这篇文章拆的是一个很具体、也很快会变成共性的问题:当团队开始把 OpenClaw / Pi 这类 coding agent 往真实产品里塞时,真正先卡住你的,通常不是模型能力,而是 CRM、ERP、邮件、session 和 CLI 接口有没有被整理成 Agent 也能顺手工作的系统。
这场分享我挺喜欢,因为它没继续停在“Agent 很神”“OpenClaw 很酷”这种泛泛讨论上。它直接往前走了一步,碰了一个更硬的问题:如果把 coding agent 当成产品能力,应该怎么塞进真实业务系统里?
这也是现在很多团队迟早会遇到的一道坎。
会写 demo,不等于能做产品。会让 Agent 跑 shell,也不等于它能稳定处理邮件、CRM、ERP、客户上下文和会话状态。真正麻烦的地方,在于怎么把原本只适合人类操作的软件世界,改造成 Agent 也能自然工作的形态。
Matthias 这场 talk 的价值,就在这里。他没试图发明一套宏大理论,只给了一个很务实的判断:别和 coding agent 对着干,先把系统做成它容易工作的样子。
这句话看着平平,后劲其实很大。
一、先别神化 Agent,Pi 的底层并不复杂
他一开始就把这件事讲得很坦白。
OpenClaw 看上去像在“学习”,像在“发现能力”,像在“自己拼装解决方案”。但如果把幕布拉开,你会发现底层其实没有那么玄。Pi 这种最小 coding agent SDK,本质上就是一个 LLM agent 在循环里调用工具。
目标给进去。
上下文给进去。
工具列表给进去。
然后模型开始做 tool call,拿到结果,再继续下一轮。
就这么回事。
这件事的重要性在于,它把很多人对 Agent 的误解先拆掉了。
有些人一看到 OpenClaw、Claude Code 这类东西,就容易脑补成一种新物种,仿佛它们自己长出了一整套神秘能力。Matthias 的态度更冷静,他的意思大概是:先别急着迷信,先把结构看清。看清之后反而更有用,因为你会意识到,既然它本质上还是“模型 + 上下文 + 工具循环”,那真正的产品机会就不在于喊概念,而在于你怎么组织上下文,怎么暴露工具,怎么设计会话边界。
这也是 Pi 吸引他的地方。它够小,够薄,也够容易拆开。它不是那种已经给你包好一切、你只能调参数的 SDK,你真能把里面的核心机制看明白,甚至直接拿来改、拿来嵌进你自己的系统里。
二、最值得记住的一句话:Make it easy for coding agents
如果整场 talk 只记一句,我会记这句:make it easy for coding agents。
这句话很像一句口号,但它其实是个架构原则。
很多团队做 Agent 产品时,天然会从“现有系统长什么样”出发。原本 CRM 怎么设计,ERP 怎么设计,权限怎么设计,页面怎么设计,流程怎么设计,就继续沿用。然后再在最上面糊一层 agent,让它想办法适应这些复杂性。
问题是,人类能忍受的复杂性,Agent 未必擅长处理。
人看到一个巨大的后台页面,靠经验知道下一步点哪里。人看到一张字段很多、命名混乱的 Excel,也许还能靠业务感觉凑合推进。Agent 不一样。你给它的接口越乱,它越容易在理解成本、调用成本和错误率上全面上升。
所以 Matthias 这个判断很务实:别一上来就想着让 Agent 去补你系统的烂设计。更合理的办法,是把系统改造成 Agent 更容易理解、更容易调用的样子。
说白了,先别问 Agent 能不能适应系统,先问系统有没有为 Agent 做过设计。
这背后的味道其实和过去 API-first 的产品思路很像。以前我们说系统要对开发者友好,现在等于多了一层,系统还得对 Agent 友好。
这会带来一个很直接的变化:很多过去面向“人”的系统边界,接下来都得多问一句,Agent 用这个舒服吗?
三、Pi 的价值,不在于多强,而在于足够小、足够可拆
Matthias 反复强调一个点,Pi 适合拿来折腾。
这句话我挺认同。
现在市面上很多 Agent 框架的问题,不在能力不够,在“包太大”。你可以用,但不容易看懂。你可以接,但不容易改。对真正想把 Agent 嵌入产品的人来说,这种黑盒很快就会碰壁,因为你需要的从来不只是“跑起来”,你还得能“按照自己的业务边界重组它”。
Pi 这种最小 SDK 的好处,就在于它天然更像一个骨架。
你能看到 agent class。
你能看到 prompt 怎么喂。
你能看到事件系统怎么发。
你能看到 hook 在哪里接。
你甚至能很直接地理解,“哦,它就是一个会不断调用工具的东西”。
这类骨架对于做产品嵌入特别重要。因为产品集成阶段最怕的,不在能力弱,在结构重。结构太重,你做每一步改造都像在抬一辆整车。结构够轻,你才有机会把它重组进自己的邮件入口、业务路由、权限体系、上下文体系和会话体系里。
四、从 core agent 到 coding agent,变化只有一个,运行时进来了
他在分享里有个区分挺清楚。
普通 agent,本质上还是模型加工具循环。
coding agent 往前多走一步,它有了 runtime,有了 shell,于是它不只是“理解”和“选择”,还能真正去执行。比如 bash、ffmpeg、CLI、小脚本、数据清洗,这些都开始变成它可操作的动作空间。
这也是为什么 OpenClaw 这类东西会给人一种“它在学”的感觉。
它并不是真的“学会了”语音处理。更准确地说,是它在面对语音消息时,发现系统里有 ffmpeg 之类的工具,于是把这些工具串起来,完成一个以前没被写死的任务链。对外部观察者来说,像是能力长出来了。对系统内部来说,只是工具调用路径被探索出来了。
这个区分很重要。
因为它会反过来影响产品设计判断。很多人做 Agent 产品时,总想着继续给模型“灌知识”。但很多时候,真正缺的不是知识,是可执行的动作空间。当 runtime 和 shell 进来以后,产品边界一下会宽很多。以前做不到的事,未必是模型不会,可能只是系统没给它一条顺手的路。
五、真正有意思的部分,是把 coding agent 从“开发工具”挪到“业务流程引擎”
这场 talk 最有价值的地方,在后半段。
Matthias 不是只在讲“怎么用 Pi 做个更顺手的开发助手”,他是在展示另一种想法:如果 coding agent 的本质是“会在循环里调工具、会执行 shell、会记会话上下文”,那它是不是可以从开发工具,变成业务系统里的一个执行节点?
他举的例子是一个 B2B 销售流程。
客户的 RFP 邮件进来。
系统监控 inbox。
根据客户信息,把请求路由到不同 agent。
每个客户对应一个 agent,会带着这个客户自己的规则文档、上下文说明和历史 session。
然后 agent 再通过一组 CLI 工具去访问 CRM、ERP 等内部系统,把需要的数据取出来,最后产出一个 draft 邮件,交给人类在 inbox 里审阅和发送。
这个设计我觉得很聪明,因为它没有强迫用户跳进一个新界面学习复杂的 Agent 操作。用户最终看到的,只是自己熟悉的邮箱里多了一份已经起草好的回复。
也就是说,Agent 真正被嵌进了流程,但没有粗暴地改变人类原有的工作入口。
这是很多 Agent 产品现在容易做反的一点。大家太喜欢造一个新工作台、新面板、新 dashboard,好像只有这样才像“AI 产品”。Matthias 这个思路更克制:用户留在 inbox 就行,Agent 在后台把脏活累活跑完。好的产品感,不靠把 AI 做得显眼,靠的是把交付结果做顺手。
六、Session 不是附属品,它是业务记忆层
他在这个案例里强调了一个点,我觉得特别重要:session 要复用。
每个客户一个 agent。
每个客户一个 general harness。
每个客户还有 customer-specific 的上下文说明。
每个 case 再挂到对应 session 上去持续往返。
这套设计看起来像实现细节,实际上已经非常接近业务记忆层了。
因为很多业务不是“一次问答”能做完的。尤其邮件往返、客户报价、权限判断、定制折扣、联系人变动这种事情,本身就有连续性。如果每次都开一个干净新对话,Agent 永远像一个失忆的实习生。只有 session 能持续复用,它才有可能慢慢像一个真的在跟进客户的角色。
这也是为什么 OpenClaw 这一类框架在企业场景里会比单纯聊天机器人更有潜力。聊天机器人适合一次性交互。业务 Agent 需要的是记忆、路由和持续状态。
换句话说,部署的已经不是一个更会说话的工具,更像是一个能沿着业务线索继续工作下去的执行体。
七、为什么他说“CLI 是现在最适合给 Agent 的接口”
这个判断也很有意思。
他在案例里没有把 CRM、ERP 这些内部能力先做成一个花哨的可视化交互层,再去想怎么让 Agent 用。相反,他的做法是把这些能力整理成一组小 CLI,让 Agent 直接调用。
这其实非常符合当下 coding agent 的工作习惯。
Agent 擅长什么?
不是读复杂页面。
也不是猜按钮逻辑。
它更擅长结构清晰、输入明确、输出稳定的命令式接口。
CLI 恰好满足这些条件。
从工程角度看,这也是一个很现实的折中:
- 比直接给数据库权限安全一些。
- 比让 Agent 硬啃网页 UI 稳定一些。
- 比重做一整套专门的 Agent API 便宜一些。
所以他这里的核心动作很实在,不是高喊“我把业务系统 AI 化了”。他先把业务系统里最关键的能力压缩成 Agent 容易用的 CLI。
这一步很像修路。路修好了,后面的 Agent 才能顺着走。
八、这场分享真正提醒人的,是“Agent 产品化”的重点变了
看完之后我最大的感受是,很多人对 Agent 产品化的关注点可能放错了。
大家容易盯着这些问题:
- 模型够不够强?
- 会不会多 Agent?
- 会不会自己调用工具?
- 会不会做 UI 交互?
这些当然重要,但在真正嵌进业务系统时,更先卡住你的,往往是另外几件事:
1. 你的数据访问方式是否对 Agent 友好
如果内部系统只有人类才看得懂的页面和流程,Agent 就会很痛苦。
2. 你的工具接口是否足够小、足够稳
一个大而全、输出混乱的工具,对 Agent 来说通常比没有还糟。
3. 你的 session 和上下文是不是业务化的
如果客户规则、案例历史、权限边界都不跟着 session 走,Agent 做到一半就容易失忆。
4. 你的产品入口是不是顺着用户原有习惯
用户想要的是完成工作,不一定想额外学习一个“AI 控制台”。
从这个意义上说,Agent 产品化不只是把模型接进去,更像是在重新发明一层“给 Agent 用的软件接口”。
这层接口设计得好,模型会显得异常聪明。
这层接口设计得差,再强的模型也会像在泥地里跑步。
九、OpenClaw 给人的启发,可能在于“理解它为什么能接住 Pi”
Matthias 在 talk 里还讲了 OpenClaw 和 Pi 的关系,这部分也挺关键。
他的意思大概是,OpenClaw 做的很多大能力,比如多 channel、provider orchestration、subagents、gateway、session stream 这些,并不是平地起高楼。它下面其实吃的还是 Pi 这种更基础的核心包能力。
这件事真正有启发的地方,不在“OpenClaw 多强”,而在于:一个能长成产品级 Agent 系统的框架,底层最好有足够小、足够清楚、足够可组合的核心部件。
这也解释了为什么很多人表面上是在研究 OpenClaw,实际更应该研究的是它底下那些最小能力单元到底怎么拼。
因为最终进企业、进产品、进业务流程的,不会是一整坨概念,更像是一层层可组合的能力:
- session
- agent loop
- tool interface
- runtime
- event
- hook
- channel
- routing
能把这些东西看明白的人,后面做产品时会比只会“调用某个 AI 平台”更有主动权。
附:视频信息
- 视频来源:https://www.youtube.com/watch?v=vAIDdLKB6-w
- 演讲标题:A Piece of Pi: Embedding The OpenClaw Coding Agent In Your Product — Matthias Luebken, Tavon
- 频道:AI Engineer
结尾
这场分享没有讲什么惊天动地的新理论,但我反而觉得它很值。
因为它把一个很现实的问题讲清楚了:如果 coding agent 真的要进产品,最该优化的地方还是系统和接口。
Pi 给的是最小骨架。
OpenClaw 展示的是更复杂的外层系统怎么长出来。
而 Matthias 这场 talk 补上的,是中间最关键的一层:怎么把业务世界改造成 Agent 也能舒服工作的形态。
这比“再做一个 Agent demo”重要得多。
接下来会越来越多团队发现,Agent 能不能落到业务里,拼到最后可能不只看模型分数,也不只看谁喊的概念更大,更看谁更早意识到一件朴素的事:
别让 Agent 去迁就烂系统,先把系统修成 Agent 容易工作的样子。