大模型周刊第26期 (2026年3月28日-4月3日)

能力还在狂飙，边界却先塌了：AI 编程与智能体加速落地的一周，也是一周里安全感快速流失的一周

这不是一份“谁又更新了什么”的周报

如果只看表层，这一周当然很热闹：OpenAI 再拿巨额融资，Google 继续推进 Gemini 生态，智谱把国产编程模型的上限往上抬了一截，OpenClaw 在中文互联网越烧越旺，DeepSeek 也因为能力升级再次被大规模讨论。

但如果只按“厂商更新列表”来写，本周最关键的东西会被漏掉。

这一周真正值得警惕的，不只是模型更强了，而是模型开始更深地进入高权限工作流，而安全边界、组织纪律和人的风险意识并没有同步跟上。

换句话说，这不是普通的一周。这是一周里，AI 从“聪明工具”继续滑向“高权限执行者”，而整个行业对后果的准备明显不足。

这也是为什么，本期周刊不该只是功能汇总，而应该把主问题说清楚：

能力提速与风险外溢，正在同时发生。

一、本周最重要的变化：AI 已经不满足于回答问题，而是在接管真实工作流

过去大家讨论模型，重点常常放在“更会写”“更会推理”“更懂上下文”。但到了 2026 年春天，竞争焦点已经明显变了。

现在真正决定用户迁移的，越来越不是聊天表现，而是：

能不能写代码并参与项目协作
能不能调用工具并穿透多步骤任务
能不能直接进入终端、仓库、浏览器、账号体系
能不能从“建议者”变成“执行者”

这就是为什么 OpenClaw 会在中文互联网突然爆开，为什么 Claude Code 一举一动都会被开发者放大，为什么智谱的编程能力提升会被中文开发者圈高度关注，为什么 Google 和 MiniMax 这种“把模型真正接进工作流”的动作正在变得更重要。

行业已经不再只比谁最聪明，而是在比谁能更深地进入真实生产环境。

而一旦进入生产环境，问题就不再只是“效果好不好”，而会立刻变成：

权限怎么给
边界怎么设
供应链怎么防
出事以后会炸到哪一层

这正是本周真正可怕的地方。

二、Claude Code 源码泄露：这不是八卦，这是 AI 工具链已经进入“可被逆向、可被复制、可被攻击”的阶段

本周最具象征性的事件之一，就是 Claude Code 源码通过 npm sourcemap 暴露 引发的大规模讨论。

从公开报道和社区分析来看，这次事故并不是传统意义上的“仓库被拖库”，而更像是一次工程发布链条上的失误：一个本不该被带出的 sourcemap 文件，把大量 TypeScript 源码结构暴露给了外界。随后，镜像、分析、移植、逆向研究迅速扩散。

如果把这件事只当成“Anthropic 出了个包管理失误”，就太轻了。它真正说明的是：

1. AI 编程工具已经进入高价值目标区

大家之所以会疯狂围观 Claude Code 的内部实现，不是因为猎奇，而是因为它已经被视为下一代高生产力编码代理的代表样本。只要它真的在工程实践里跑得动、跑得快、跑得稳，它的内部结构就天然具备研究价值、模仿价值，甚至攻击价值。

2. AI 产品的风险不再只在模型，而在整个发布与分发链条

很多团队仍然习惯把安全理解为“模型会不会越权、会不会胡说”。但这次事件提醒的是另一个层面：你的打包链路、npm 发布配置、source map、依赖分发、权限边界，本身就是风险面。

模型能力越强，围绕它的工具链价值越高，工程细节里的一个疏漏，就越容易被放大成全行业事件。

3. 当代码助手深入开发流之后，“泄露”不只是品牌损伤，而是能力扩散与威胁建模失效

过去很多软件源码泄露，更多是商业层面的尴尬；但在 AI 编程工具时代，源码暴露往往还意味着：

竞争对手可以更快拆解你的系统设计
社区会迅速复刻你的关键能力
攻击者也能更清楚地理解你的防护、限制与行为路径

这就是为什么，这件事值得被放在本周主线，而不是当成一个花边新闻。

三、GitHub、维护者账号、设备被攻破：当 AI 工具深入开发环境，链式失守会越来越常见

你提到的另一个判断也非常关键：本周更可怕的，不是某个账号单点失守，而是从 GitHub 到设备、从仓库到终端的链式攻破开始显性化。

这一周围绕 GitHub 账户接管、供应链污染、维护者凭证泄露、恶意提交扩散的安全新闻并不少。即便不把所有案例都归到同一个事件上，也已经足够说明一个趋势：

开发者工作环境正在变得前所未有地脆弱。

过去，“GitHub 被黑”常常意味着仓库被改、token 泄露、包被投毒；现在，随着 AI 编程工具、自动化代理、终端权限、浏览器登录态与本地设备进一步打通，单点失守的后果正在升级：

仓库可能被改
工作流可能被植入恶意内容
本地 token 可能被继续横向利用
登录态和 SSH 环境可能被进一步串走
设备本身也可能变成下一跳攻击入口

这意味着一个维护者、一个主理人、一个工程负责人如果出事，后果不再只是“这个 repo 先别用了”，而是整套工作环境可能一起下沉。

在 AI 工具全面接入开发流程之后，这种风险只会更频繁，而不会更少。因为 AI 正在让更多自动化能力、更多默认权限、更多跨系统调用变得合理化、日常化、甚至“无感化”。

这就是为什么我说，这一周最可怕的地方不是单条新闻本身，而是它们共同暴露出来的现实：

我们正在把更强的能力接进更脆弱的系统。

四、OpenClaw 爆火：本地自主代理终于进入大众视野，但安全焦虑也会一起放大

如果要选一个最能体现“能力提速”这条主线的产品，本周就是 OpenClaw。

它在中文互联网的传播，已经不再是极客圈自嗨，而是进入了更广泛的普通用户、效率用户、自动化爱好者和企业探索者视野。所谓“全民养龙虾”，表面上看像梗，实质上反映的是一件更重要的事：

越来越多人第一次认真体验到，一个模型不只是陪聊，而是真的可以去点网页、调服务、接消息、串流程。

这件事为什么重要？因为它意味着本地智能体终于从“演示视频中的未来”，变成了“普通人今天就可以尝试的能力”。

但恰恰是这种出圈，也把另一面一并推到了台前。

从公开报道和市场反应来看，OpenClaw 的爆火几乎是和安全争议同步上升的：

本地代理天然拥有更接近操作系统的权限想象空间
用户会尝试让它接管邮件、支付、浏览器和消息系统
平台和监管方会担心数据外流、误操作、权限失控
企业在真正接入前，会先问风控和可审计性

所以 OpenClaw 本周最值得看的，不只是它有多红，而是它已经非常真实地把行业推到了一个问题前：

当“能执行的模型”开始普及，默认安全模型应该长什么样？

如果这个问题没有先被解决，那么越成功的智能体，越会先遇到边界问题。

五、智谱 GLM-5.1：国模编程能力终于开始进入“值得严肃比较”的区间

和安全线并行的，是能力线仍在高速上冲。

这周中文开发者圈最强烈的感受之一，就是 GLM-5.1 把国产模型的编程能力又往前推了一截。无论具体 benchmark 最终怎么被独立检验，有一件事已经很明显：

讨论方式变了。

以前大家谈国产编程模型，常常还是“有没有希望”“能不能追上”；这周开始，更多人在用一种更直接的方式讨论：

能不能拉进一线工作流比较
在真实编码协作里排第几
能不能替代某些闭源模型的日常位置

这意味着什么？意味着国产编程模型已经从“题材”走向“排序”。

这类变化往往比一时的热搜更重要。因为只有当用户愿意把一个模型放进真实工作流里比较，它才真正进入产业竞争区。

六、Google、MiniMax、Kimi、DeepSeek：所有人都在往“更贴近工作流”这条路上挤

如果把这周其他几家的动作放在一起看，会发现一个共同点：

它们也许 headline 不同，但方向高度一致——都在试图把模型变成更顺手的工作系统，而不是更花哨的聊天产品。

Google

Google 最近的推进方式不够炸裂，但很稳。Search Live、Gemini 与办公套件的整合、实时能力、多模态 API 的持续扩展，背后的逻辑很明确：它不只是做模型，而是在铺“模型如何进入现有产品与企业体系”的路。

MiniMax

MiniMax 这周更有代表性的，不是某一个单点功能，而是它把多模态能力往统一订阅和统一调用入口上收。这种事短期看不如新模型刺激，但长期更接近企业真正要买单的东西：接入效率。

Kimi

Moonshot 本周声量不算最大，但它在长文档理解、前置吸收和工作流组合里的位置依然稳。现在很多人的实际使用方式已经不再是单模型通吃，而是多模型分工——这意味着 Kimi 这种“理解层角色”依然重要。

DeepSeek

DeepSeek 则是另一个典型：能力升级带来了明显的用户感知，但稳定性问题也立刻被放大。对一个已经拥有大规模用户的平台来说，这种问题已经不只是体验波动，而是商业信任问题。

DeepSeek 本周真正值得记住的，不是“是不是 V4 灰度了”，而是：

能力提升已经不再自动带来口碑增长，稳定性和基础设施反而会成为下一阶段最硬的门槛。

七、OpenAI 的融资，不只是资本新闻，而是在给下一轮高强度竞争备弹药

如果说安全线揭示的是行业的脆弱性，那么 OpenAI 的巨额融资则体现了另一面：

这场竞争不会因为风险暴露而减速，反而会继续加速。

资本的意义，不只是估值更高，而是：

可以继续烧基础设施
可以继续做高成本研发
可以继续抢顶级人才与组织能力
可以继续把“能力 → 产品 → 平台”这条链路推进下去

所以本周真正危险、也真正现实的地方在于：

风险已经开始暴露
但产业不会因此踩刹车
大家只会更快地把模型接进开发流、办公流、代理流、终端流

这就意味着，接下来几个月，类似本周这样的“功能进展”与“安全事故”并行出现，会越来越常见。

八、本周真正应该记住的判断

如果一定要给这一周留一句判断，我会写：

2026 年的大模型竞争，已经从“谁更聪明”进入“谁更深地接入现实系统”，而真正的短板，开始从模型能力转向安全、稳定性与治理能力。

这句话里有三层意思：

1. 能力竞争不会停

国模继续追，闭源模型继续卷，智能体继续扩张，资本继续加注。

2. 风险竞争已经开始

源码泄露、供应链污染、账号攻破、设备失守、平台风控、权限越界，这些不会是偶发现象，而会成为“AI 深度接入生产环境”后的常态风险。

3. 真正决定下一阶段胜负的，不只是模型表现，而是组织是否能承受它带来的风险半径

这件事对个人开发者、团队负责人、平台产品经理、企业采购者都一样成立。

九、给读者的动作建议

如果你只是看热闹，这一周会很刺激；但如果你真的在用这些工具干活，这一周更像是一记提醒。

对个人开发者

不要再把 AI 编码工具当成“更聪明的插件”看待
重新检查 GitHub、SSH、终端、包管理器和本地 token 的边界
对任何接入终端、浏览器登录态、仓库写权限的工具，都要重新评估默认信任等级

对团队

开始把 agent / code assistant 纳入正式安全审查，而不是当试验工具放养
给模型和工具设权限分层，不要默认放通生产级能力
建立供应链、依赖、CI/CD 与账号体系的联动监控

对平台与产品方

未来真正拉开差距的，不只是“更强”，而是“更可控、可审计、可恢复”
安全能力不能再放在 PR 之后补，它必须变成产品定义的一部分

结语

这一周看上去像是 AI 行业继续繁荣的一周，但从更深的层面看，它更像一个拐点提醒：

模型已经开始接管更多真实动作，而人类社会关于权限、责任、审计和风险的那套旧规则，还没来得及完全更新。

所以，这一周真正可怕的，不是某一条事故新闻，而是这些事故背后指向的是同一个趋势：

AI 正在更快地进入系统，而系统还没有准备好。

这才是本周最应该被记住的事。

如果你愿意，下期我会继续按这个口径写，不再做“新闻清单”，而是专门抓：
- 哪些变化真的会改写接下来 3 个月的行业走向
- 哪些事故代表着新的系统性风险已经开始出现
- 哪些工具已经值得用“生产环境武器”而不是“效率玩具”去看待

大模型周刊 第26期 (2026年3月28日-4月3日)