2026-02-27 · 架构
32
架构 · 2026-02-27

一天 627 次提交背后:OpenClaw 作者 Peter 的 AI 研发实践,以及我们该如何构建自己的 Vibe Coding 体系

参考文章:https://mp.weixin.qq.com/s/B5hK8BywPla6LG3hVxHGqA
参考提交:https://github.com/openclaw/openclaw/commits/main/?since=2026-02-22&until=2026-02-22&author=steipete

很多人看到 Peter(OpenClaw 作者)一天 627 次提交,第一反应是:

但如果把提交节奏、commit 语义、修复路径和测试轨迹放在一起看,结论其实很清楚:

这不是“人类写得更快”,而是“AI 研发流水线在高频闭环”。

换句话说,Peter 的核心能力不是“敲代码速度”,而是“把研发系统设计成可自动循环的机器”。


一、Peter 的实践到底强在哪?

1)提交粒度极小:把复杂度切碎

从公开提交看,Peter 的很多 commit 都是小步快跑:

这意味着每个提交关注一个非常小的目标。好处是三件事:

  1. 定位快:出问题时,几分钟就能锁定到具体改动;
  2. 回滚快:小提交可逆,风险局部化;
  3. 并行快:AI 更容易在小任务上稳定执行。

2)commit 语义机器可读:不是写给人看,而是写给系统看

type(scope): message 不是“格式洁癖”,是自动化前提。

当 commit 语义标准化后,系统可以自动做:

3)AI 闭环执行:不是单轮问答

很多团队对 AI 编程的理解还停留在:

人提问 → AI 给一段代码 → 人手工改 → 人手工测。

Peter 的模式更接近:

AI 发现异常线索 → AI 修复 → AI 写/改测试 → AI 跑验证 → AI 再修复 → 通过门禁后提交。

这是循环系统,不是聊天工具。

4)“人上移、机下沉”:人管规则,机器管执行

Peter 的关键不是盯着 AI 每一行,而是把精力放在:

这正是 AI 时代研发管理最重要的迁移:

从“亲自执行”迁移到“设计执行系统”。


二、把这套方法落到团队:一个可执行的研发体系

如果我们希望复制这种效率,不是“让工程师更拼”,而是设计一个四层架构。

1)Policy 层(规则层)

定义统一规则:

这个层解决的是:什么是允许的、什么是禁止的。

2)Execution 层(执行层)

由 AI 代理承担大部分机械执行:

这个层解决的是:谁来做、怎么自动做。

3)Gate 层(门禁层)

每次提交必须过统一裁判:

这个层解决的是:做完了是否能进主干。

4)Delivery 层(交付层)

这个层解决的是:上线后怎么可控。


三、Vibe Coding 代码规则体系(建议版)

下面这套规则可以直接作为团队 v1:

A. Commit 规则(最关键)

  1. 必须使用 type(scope): summary
  2. type 限制为:feat|fix|refactor|test|docs|chore|perf|ci
  3. 一次提交只做一件事(单主题);
  4. 默认小提交(例如 20~80 行级别,按仓库可调);
  5. 高风险改动必须拆分成多次可回滚提交。

B. PR 规则

  1. PR 描述必须包含:背景、改动点、风险、回滚方式;
  2. AI 产出必须附验证结果摘要;
  3. 未通过门禁不得合并;
  4. 超大 PR(例如 >500 行)必须拆分。

C. 测试规则

  1. 新功能必须配测试;
  2. Bug 修复必须有失败用例;
  3. 测试不通过不允许“先合并后修”;
  4. flaky 测试必须进入治理池,不能长期忽略。

D. 安全规则

  1. 禁止 AI 直接改密钥与生产权限策略;
  2. auth/payment/security 目录启用双门禁;
  3. 依赖升级必须过漏洞与许可证检查;
  4. 出现敏感泄露自动阻断合并。

E. 发布与回滚规则

  1. 每次发布都要可回滚;
  2. 默认灰度,监控异常自动回退;
  3. 回滚后自动创建复盘任务(不是口头复盘)。

四、现实问题:这套体系会不会把人“边缘化”?

不会,反而会提升工程师价值密度。

在这套体系里,人的价值从“打字速度”转向:

一句话:

不是 AI 取代工程师,而是“不会系统化使用 AI 的研发方式”会被淘汰。


五、我们可以怎么开始(30 天落地路线)

第 1 周:先立规则,不改组织

第 2 周:引入 AI 执行闭环

第 3 周:上线风险控制

第 4 周:度量与复盘

关注四个指标:

  1. Lead Time(需求到上线时长);
  2. Change Failure Rate(变更失败率);
  3. MTTR(平均修复时间);
  4. 回滚频率与根因分布。

结语

Peter 的“627 次提交”最值得学的,不是速度神话,而是工程方法论:

真正的 Vibe Coding,不是“感觉写代码”,而是:

在明确边界和规则的前提下,让机器稳定地产生可验证、可回滚、可持续的研发产出。

如果你也在做 AI 研发转型,建议从今天开始问一个问题:

我们是在“用 AI 帮人写代码”,还是在“搭建 AI 驱动的研发系统”?

这两者的效率差,会越来越大。

目录 最新
← 左侧翻上一屏 · 右侧翻下一屏 · 中间唤出菜单