2026年4月18-24日 · 第28期 · 每周五发布
本周关键词:Agentic Workflows · 开源围剿 · 蒸馏摩擦 · 定价博弈
TL;DR — 30 秒看完本周
如果你只有 30 秒,记住这五件事:
- OpenAI 发布 GPT-5.5,主打"自主完成复杂任务",同步推出 Images 2.0(gpt-image-2),图像生成能力跃升一个台阶
- 月之暗面 Kimi K2.6 开源,1T 参数 MoE,连续编码 12 小时+,300 子代理协作,首发即炸服
- DeepSeek V4 预览版发布,1.6T 参数开源,Hybrid Attention 架构,编码基准领跑
- Anthropic Claude Opus 4.7 正式 GA,编码 + 代理编排持续领先,定价不变
- OpenClaw 代理框架成为事实标准,Nvidia CEO 喊话"每家企业都需要 OpenClaw 策略"
一句话总结:AI 竞赛已从"谁的模型更大"转向"谁的代理更自主、更可靠、更可控"。本周,这个转折被所有玩家同时盖章确认。
一、OpenAI:GPT-5.5 + Images 2.0,双线作战
OpenAI 本周动作最密集,产品迭代和政策讨论双管齐下。
产品矩阵
发布项
日期
亮点
GPT-5.5 + 系统卡
4/23
为自主代理工作流设计,多步任务、自主编码、数据分析,安全评估目前最严
ChatGPT Images 2.0
4/21
新模型 gpt-image-2,独立架构(非 GPT-4o),支持"思考后渲染"、多语种文字、最高 2K 分辨率
Responses API WebSockets
本周
加速代理工作流的实时通信管道
GPT-5.4-Cyber
本周
限制访问的网络安全专用模型,面向 Trusted Access 伙伴
Privacy Filter
本周
企业级隐私过滤层
企业与政策
- "企业 AI 下一阶段":加速推进 Frontier/ChatGPT Enterprise/Codex 在行业的落地
- 《Intelligence Age 工业政策》持续发酵——四天工作周、机器人税、公共财富基金,应对 AI 对劳动力市场的冲击
- 有报道称领导层变动,部分消费级项目让位于企业解决方案
💡 编辑点评
Images 2.0 是本周最出圈的产品。"思考后渲染"这个设计——先规划构图、验证约束、甚至联网搜索参考——本质上把图像生成从"随机出图"变成了"有意识的创作"。支持中日韩等非拉丁文字的精确渲染,直接打掉了此前所有模型的痛点。
GPT-5.5 则在代理方向彻底亮牌:未来的 ChatGPT 不是聊天工具,是你的数字同事。
二、Anthropic:Opus 4.7 稳扎稳打
Anthropic 本周相对安静,但动作精准。
核心更新
- Claude Opus 4.7 正式 GA(4/16 发布,本周全面铺开)
- 定价不变:$5 / $25 per million tokens(输入/输出)
- 新增
xhigh推理等级,在复杂问题上让用户精细控制推理深度 vs 延迟 - 编码、代理编排、视觉理解、多步任务全面升级
- 自动检测并阻止高风险网络安全滥用
- Claude Design 视觉协作工具:创建设计稿、原型、幻灯片
- Agent Client Protocol 小版本更新
- 2026 Agentic Coding Trends Report 发布:讨论工程师角色转变与多代理协调
💡 编辑点评
Opus 4.7 的
xhigh推理等级很有意思——它承认了一个事实:不是每个问题都需要拉满推理。这是一种"把选择权还给用户"的设计哲学。Anthropic 的节奏一直是"少说多做":不急于做消费级爆款,而是把编码和代理这两个高价值场景做到极致。本周报告直接定义了"Agentic Coding"这个品类。
三、Google:Gemma 4 的长尾效应
Google 本周无重大旗舰发布,但开源影响力持续扩散。
关键动态
- Gemma 4 持续发酵(3/31 发布,Apache 2.0 许可)
- 四个尺寸:E2B → E4B → 26B A4B(MoE) → 31B(Dense)
- 从手机到数据中心全覆盖,支持 NVIDIA、AMD、Google TPU
- 开发者评价:"字节对字节竞争力最强的开源模型家族"
- Gemini 生态预热:Search Live、Personal Intelligence、文档工具更新
- Google I/O 2026 倒计时(5 月):Gemini 4 等旗舰将正式发布
💡 编辑点评
Gemma 4 的策略很清晰:不跟闭源模型拼天花板,而是把"可部署性"做到极致。一个 2B 参数的模型能跑在手机上做复杂推理——这才是 AI 民主化的真正含义。
5 月的 Google I/O 才是正菜。Gemini 4 如果能在代理能力上追平 Claude/GPT,Google 的生态优势将全面释放。
四、月之暗面(Moonshot AI):Kimi K2.6 一鸣惊人
本周最大的惊喜来自中国。
Kimi K2.6 核心参数
指标
数据
发布日期
4/20,开源
总参数
1 万亿(MoE)
激活参数
32B
连续编码
12-13 小时
多代理集群
300 子代理,4000+ 协作步
基准对标
GPT-5.4 / Opus 4.6
兼容框架
OpenClaw / Hermes
首发风波
K2.6 发布后因流量激增出现:
- 排队等待时间过长
- 额度扣除计算错误
Moonshot 的回应堪称教科书级:直接将所有用户月度额度重置为 100%。
💡 编辑点评
K2.6 的亮点不在参数量——1T MoE 现在已经不算稀奇了。它的杀手锏是长时自主执行:一个代理能连续编码 12 小时,300 个子代理同时协作 4000+ 步。这不是聊天机器人,这是一个自主开发团队。
首发翻车和补偿的故事,反而证明了用户基数和热情之大。能把 Moonshot 的服务器打爆——这本身就是最好的市场验证。
五、智谱 AI:GLM-5.1 涨价与突围
智谱本周围绕 GLM-5.1 的商业化持续推进。
关键动态
- GLM-5.1 迭代(4/8 发布,影响延续)
- 增强编码与长时代理任务(可自主运行数小时)
- 部分基准接近 Claude Opus 水平
- 强调国产芯片(华为 Ascend)训练
- 价格调整
- API 价格上调 8%-17%,平均约 10%
- 海外 Coding Plan 部分套餐翻倍(如 Max 套餐 $80 → $160)
- 老套餐从"不限量"迁移为"5 小时限额 + 周限额"
- 补偿措施:受影响用户获 2 个月新套餐权益
💡 编辑点评
智谱的涨价是中国 AI 行业货币化压力的缩影。当"价格战"的子弹打光,所有人都必须面对一个现实:大模型不是免费午餐,算力成本始终在那里。
但涨价的时机需要考量。当 Kimi K2.6 和 DeepSeek V4 都在走开源 + 低成本路线时,智谱需要用更强的产品力来证明溢价的合理性。
六、DeepSeek:V4 闪击入场
今日(4/24)DeepSeek 亮出王牌。
V4 系列核心参数
模型
总参数
激活参数
上下文窗口
定位
V4-Pro
1.6T
49B
1M tokens
旗舰推理 + 代理编码
V4-Flash
284B
13B
1M tokens
高效推理,接近 Pro
技术亮点
- Hybrid Attention 架构:长上下文记忆效率大幅提升
- 开源开权重:Hugging Face 可下载,兼容 OpenAI / Anthropic API 格式
- 编码基准领跑开源社区
- 老模型(deepseek-chat / deepseek-reasoner)将于 7/24 退役
💡 编辑点评
DeepSeek 的节奏一直令人印象深刻:不追求"最强"的虚名,而是在开源领域做到性价比最优。V4-Pro 的 1.6T 参数只激活 49B——这个效率比令人侧目。
"落后 SOTA 3-6 个月"这个自我定位非常聪明:承认差距,但用开源和成本优势来重新定义游戏规则。当闭源模型标价 $5/$25 per M tokens 时,DeepSeek 要做的是让同等能力的模型免费可用。
七、OpenClaw:代理基础设施的事实标准
OpenClaw 不是一家公司,而是一个代理时代的 Linux。
本周要点
- 下载量继续爆发式增长
- Nvidia CEO 黄仁勋高度评价:每家企业必须制定 OpenClaw 策略
- Nvidia 推出 NemoClaw 安全层——为企业部署的代理提供沙箱执行环境
- Moonshot Kimi K2.6 原生兼容 OpenClaw/Hermes 协议
- 三层架构(Channel → Brain → Body)让个人和小企业也能零代码部署自主代理
💡 编辑点评
OpenClaw 的意义远超框架本身。它正在成为代理时代的"操作系统"——就像 Android 之于移动时代。当 Nvidia 推出专门的安全层、当 Kimi K2.6 原生兼容它的协议,一个新的生态已经成型。
关键问题是治理:当一个自主代理能 24/7 执行任务、无需人类持续干预时,谁来为它的错误负责?
八、MiniMax:多模态 × 空间计算
MiniMax 本周聚焦生态与商业。
- 参与 Harvard XR 2026,展示多模态(文本/语音/视频/音乐)在 XR/空间计算的应用
- Hailuo AI 视频/创意工具持续推广
- 2026 年营收预测:$2.19 亿
- 股价因 AI 叙事波动剧烈(IPO 后一度暴涨)
九、中美交锋:蒸馏摩擦公开化
本周最值得关注的地缘动态:
- Frontier Model Forum 动作:OpenAI / Anthropic / Google 通过该联盟共享信息,联合打击"对抗性蒸馏"(Adversarial Distillation)
- OpenAI 公开点名 DeepSeek 等中国实验室,称其从美方模型中提取能力
- 中美在模型"技术溯源"问题上的摩擦,正在从幕后走向台前
💡 编辑点评
模型蒸馏的争议,本质是知识产权在 AI 时代的定义之争。当一个开源模型通过与闭源模型的 API 交互来学习——这算"合理使用"还是"技术窃取"?
这个问题没有简单答案,但它将深刻影响未来开源 AI 的生存空间。
十、本周趋势全景
五条主线
┌──────────────────────────────────────────────────────────┐
│ 1. Agentic Workflows 成为核心战场 │
│ → 长时任务、自主执行、多代理协作 │
│ 2. 开源/半开源加速 │
│ → Gemma 4 / Kimi K2.6 / DeepSeek V4 三箭齐发 │
│ 3. 定价上行压力 │
│ → 智谱涨价、OpenAI 企业化、算力成本不可回避 │
│ 4. 蒸馏摩擦公开化 │
│ → Frontier Model Forum 联合行动 │
│ 5. 代理框架标准化 │
│ → OpenClaw 成为事实标准 │
└──────────────────────────────────────────────────────────┘
各公司本周战力雷达
公司
模型发布
代理能力
开源力度
商业化
生态影响
OpenAI
⭐⭐⭐⭐⭐
⭐⭐⭐⭐
⭐⭐
⭐⭐⭐⭐⭐
⭐⭐⭐⭐⭐
Anthropic
⭐⭐⭐⭐
⭐⭐⭐⭐⭐
⭐⭐
⭐⭐⭐⭐
⭐⭐⭐⭐
Google
⭐⭐⭐
⭐⭐⭐
⭐⭐⭐⭐⭐
⭐⭐⭐
⭐⭐⭐⭐
Moonshot
⭐⭐⭐⭐⭐
⭐⭐⭐⭐⭐
⭐⭐⭐⭐⭐
⭐⭐⭐
⭐⭐⭐⭐
智谱 AI
⭐⭐⭐⭐
⭐⭐⭐⭐
⭐⭐⭐
⭐⭐⭐⭐
⭐⭐⭐
DeepSeek
⭐⭐⭐⭐⭐
⭐⭐⭐⭐
⭐⭐⭐⭐⭐
⭐⭐⭐
⭐⭐⭐⭐
下周展望
- Google I/O 2026 预热将进入高潮,Gemini 4 可能提前曝光
- 更多模型宣布原生兼容 OpenClaw,代理框架生态将进一步整合
- DeepSeek V4 正式版可能带来新一轮开源冲击波
- 中美蒸馏争议可能迎来政策层面的回应
编辑手记
本周最让人感慨的不是某个模型的参数有多大,而是一个事实:2026 年的 AI 竞赛,已经不再是参数量或基准分数的比拼。
当 Kimi K2.6 能让 300 个代理协作 4000 步、当 GPT-5.5 被定义为"数字同事"、当 OpenClaw 成为代理时代的 Android——我们正在见证一个范式转移:
从"谁更聪明"到"谁更可靠地替你干活"。
AI 不再需要证明自己能通过考试。它需要证明自己能在你睡觉的时候,帮你完成明天的工作。
保持好奇,继续探索宇宙(与 AI)。
本期内容基于公开报道汇总,旨在提供中立技术概览。欢迎读者补充具体体验或指出遗漏。