AI 周刊 #28｜Agent 觉醒周：GPT-5.5 落地、Kimi K2.6 开源炸场、DeepSeek V4 闪击，中美代理大战全面开打

2026年4月18-24日 · 第28期 · 每周五发布

本周关键词：Agentic Workflows · 开源围剿 · 蒸馏摩擦 · 定价博弈

TL;DR — 30 秒看完本周

如果你只有 30 秒，记住这五件事：

OpenAI 发布 GPT-5.5，主打"自主完成复杂任务"，同步推出 Images 2.0（gpt-image-2），图像生成能力跃升一个台阶
月之暗面 Kimi K2.6 开源，1T 参数 MoE，连续编码 12 小时+，300 子代理协作，首发即炸服
DeepSeek V4 预览版发布，1.6T 参数开源，Hybrid Attention 架构，编码基准领跑
Anthropic Claude Opus 4.7 正式 GA，编码 + 代理编排持续领先，定价不变
OpenClaw 代理框架成为事实标准，Nvidia CEO 喊话"每家企业都需要 OpenClaw 策略"

一句话总结：AI 竞赛已从"谁的模型更大"转向"谁的代理更自主、更可靠、更可控"。本周，这个转折被所有玩家同时盖章确认。

一、OpenAI：GPT-5.5 + Images 2.0，双线作战

OpenAI 本周动作最密集，产品迭代和政策讨论双管齐下。

产品矩阵

发布项
日期
亮点

GPT-5.5 + 系统卡
4/23
为自主代理工作流设计，多步任务、自主编码、数据分析，安全评估目前最严

ChatGPT Images 2.0
4/21
新模型 gpt-image-2，独立架构（非 GPT-4o），支持"思考后渲染"、多语种文字、最高 2K 分辨率

Responses API WebSockets
本周
加速代理工作流的实时通信管道

GPT-5.4-Cyber
本周
限制访问的网络安全专用模型，面向 Trusted Access 伙伴

Privacy Filter
本周
企业级隐私过滤层

企业与政策

"企业 AI 下一阶段"：加速推进 Frontier/ChatGPT Enterprise/Codex 在行业的落地
《Intelligence Age 工业政策》持续发酵——四天工作周、机器人税、公共财富基金，应对 AI 对劳动力市场的冲击
有报道称领导层变动，部分消费级项目让位于企业解决方案

💡 编辑点评

Images 2.0 是本周最出圈的产品。"思考后渲染"这个设计——先规划构图、验证约束、甚至联网搜索参考——本质上把图像生成从"随机出图"变成了"有意识的创作"。支持中日韩等非拉丁文字的精确渲染，直接打掉了此前所有模型的痛点。

GPT-5.5 则在代理方向彻底亮牌：未来的 ChatGPT 不是聊天工具，是你的数字同事。

二、Anthropic：Opus 4.7 稳扎稳打

Anthropic 本周相对安静，但动作精准。

核心更新

Claude Opus 4.7 正式 GA（4/16 发布，本周全面铺开）
定价不变：$5 / $25 per million tokens（输入/输出）
新增 xhigh 推理等级，在复杂问题上让用户精细控制推理深度 vs 延迟
编码、代理编排、视觉理解、多步任务全面升级
自动检测并阻止高风险网络安全滥用
Claude Design 视觉协作工具：创建设计稿、原型、幻灯片
Agent Client Protocol 小版本更新
2026 Agentic Coding Trends Report 发布：讨论工程师角色转变与多代理协调

💡 编辑点评

Opus 4.7 的 xhigh 推理等级很有意思——它承认了一个事实：不是每个问题都需要拉满推理。这是一种"把选择权还给用户"的设计哲学。

Anthropic 的节奏一直是"少说多做"：不急于做消费级爆款，而是把编码和代理这两个高价值场景做到极致。本周报告直接定义了"Agentic Coding"这个品类。

三、Google：Gemma 4 的长尾效应

Google 本周无重大旗舰发布，但开源影响力持续扩散。

关键动态

Gemma 4 持续发酵（3/31 发布，Apache 2.0 许可）
四个尺寸：E2B → E4B → 26B A4B（MoE） → 31B（Dense）
从手机到数据中心全覆盖，支持 NVIDIA、AMD、Google TPU
开发者评价："字节对字节竞争力最强的开源模型家族"
Gemini 生态预热：Search Live、Personal Intelligence、文档工具更新
Google I/O 2026 倒计时（5 月）：Gemini 4 等旗舰将正式发布

💡 编辑点评

Gemma 4 的策略很清晰：不跟闭源模型拼天花板，而是把"可部署性"做到极致。一个 2B 参数的模型能跑在手机上做复杂推理——这才是 AI 民主化的真正含义。

5 月的 Google I/O 才是正菜。Gemini 4 如果能在代理能力上追平 Claude/GPT，Google 的生态优势将全面释放。

四、月之暗面（Moonshot AI）：Kimi K2.6 一鸣惊人

本周最大的惊喜来自中国。

Kimi K2.6 核心参数

指标
数据

发布日期
4/20，开源

总参数
1 万亿（MoE）

激活参数
32B

连续编码
12-13 小时

多代理集群
300 子代理，4000+ 协作步

基准对标
GPT-5.4 / Opus 4.6

兼容框架
OpenClaw / Hermes

首发风波

K2.6 发布后因流量激增出现：
- 排队等待时间过长
- 额度扣除计算错误

Moonshot 的回应堪称教科书级：直接将所有用户月度额度重置为 100%。

💡 编辑点评

K2.6 的亮点不在参数量——1T MoE 现在已经不算稀奇了。它的杀手锏是长时自主执行：一个代理能连续编码 12 小时，300 个子代理同时协作 4000+ 步。这不是聊天机器人，这是一个自主开发团队。

首发翻车和补偿的故事，反而证明了用户基数和热情之大。能把 Moonshot 的服务器打爆——这本身就是最好的市场验证。

五、智谱 AI：GLM-5.1 涨价与突围

智谱本周围绕 GLM-5.1 的商业化持续推进。

关键动态

GLM-5.1 迭代（4/8 发布，影响延续）
增强编码与长时代理任务（可自主运行数小时）
部分基准接近 Claude Opus 水平
强调国产芯片（华为 Ascend）训练
价格调整
API 价格上调 8%-17%，平均约 10%
海外 Coding Plan 部分套餐翻倍（如 Max 套餐 $80 → $160）
老套餐从"不限量"迁移为"5 小时限额 + 周限额"
补偿措施：受影响用户获 2 个月新套餐权益

💡 编辑点评

智谱的涨价是中国 AI 行业货币化压力的缩影。当"价格战"的子弹打光，所有人都必须面对一个现实：大模型不是免费午餐，算力成本始终在那里。

但涨价的时机需要考量。当 Kimi K2.6 和 DeepSeek V4 都在走开源 + 低成本路线时，智谱需要用更强的产品力来证明溢价的合理性。

六、DeepSeek：V4 闪击入场

今日（4/24）DeepSeek 亮出王牌。

V4 系列核心参数

模型
总参数
激活参数
上下文窗口
定位

V4-Pro
1.6T
49B
1M tokens
旗舰推理 + 代理编码

V4-Flash
284B
13B
1M tokens
高效推理，接近 Pro

技术亮点

Hybrid Attention 架构：长上下文记忆效率大幅提升
开源开权重：Hugging Face 可下载，兼容 OpenAI / Anthropic API 格式
编码基准领跑开源社区
老模型（deepseek-chat / deepseek-reasoner）将于 7/24 退役

💡 编辑点评

DeepSeek 的节奏一直令人印象深刻：不追求"最强"的虚名，而是在开源领域做到性价比最优。V4-Pro 的 1.6T 参数只激活 49B——这个效率比令人侧目。

"落后 SOTA 3-6 个月"这个自我定位非常聪明：承认差距，但用开源和成本优势来重新定义游戏规则。当闭源模型标价 $5/$25 per M tokens 时，DeepSeek 要做的是让同等能力的模型免费可用。

七、OpenClaw：代理基础设施的事实标准

OpenClaw 不是一家公司，而是一个代理时代的 Linux。

本周要点

下载量继续爆发式增长
Nvidia CEO 黄仁勋高度评价：每家企业必须制定 OpenClaw 策略
Nvidia 推出 NemoClaw 安全层——为企业部署的代理提供沙箱执行环境
Moonshot Kimi K2.6 原生兼容 OpenClaw/Hermes 协议
三层架构（Channel → Brain → Body）让个人和小企业也能零代码部署自主代理

💡 编辑点评

OpenClaw 的意义远超框架本身。它正在成为代理时代的"操作系统"——就像 Android 之于移动时代。当 Nvidia 推出专门的安全层、当 Kimi K2.6 原生兼容它的协议，一个新的生态已经成型。

关键问题是治理：当一个自主代理能 24/7 执行任务、无需人类持续干预时，谁来为它的错误负责？

八、MiniMax：多模态 × 空间计算

MiniMax 本周聚焦生态与商业。

参与 Harvard XR 2026，展示多模态（文本/语音/视频/音乐）在 XR/空间计算的应用
Hailuo AI 视频/创意工具持续推广
2026 年营收预测：$2.19 亿
股价因 AI 叙事波动剧烈（IPO 后一度暴涨）

九、中美交锋：蒸馏摩擦公开化

本周最值得关注的地缘动态：

Frontier Model Forum 动作：OpenAI / Anthropic / Google 通过该联盟共享信息，联合打击"对抗性蒸馏"（Adversarial Distillation）
OpenAI 公开点名 DeepSeek 等中国实验室，称其从美方模型中提取能力
中美在模型"技术溯源"问题上的摩擦，正在从幕后走向台前

💡 编辑点评

模型蒸馏的争议，本质是知识产权在 AI 时代的定义之争。当一个开源模型通过与闭源模型的 API 交互来学习——这算"合理使用"还是"技术窃取"？

这个问题没有简单答案，但它将深刻影响未来开源 AI 的生存空间。

十、本周趋势全景

五条主线

  ┌──────────────────────────────────────────────────────────┐
  │  1. Agentic Workflows 成为核心战场                        │
  │     → 长时任务、自主执行、多代理协作                        │
  │  2. 开源/半开源加速                                       │
  │     → Gemma 4 / Kimi K2.6 / DeepSeek V4 三箭齐发          │
  │  3. 定价上行压力                                          │
  │     → 智谱涨价、OpenAI 企业化、算力成本不可回避              │
  │  4. 蒸馏摩擦公开化                                        │
  │     → Frontier Model Forum 联合行动                       │
  │  5. 代理框架标准化                                        │
  │     → OpenClaw 成为事实标准                                │
  └──────────────────────────────────────────────────────────┘

各公司本周战力雷达

公司
模型发布
代理能力
开源力度
商业化
生态影响

OpenAI
⭐⭐⭐⭐⭐
⭐⭐⭐⭐
⭐⭐
⭐⭐⭐⭐⭐
⭐⭐⭐⭐⭐

Anthropic
⭐⭐⭐⭐
⭐⭐⭐⭐⭐
⭐⭐
⭐⭐⭐⭐
⭐⭐⭐⭐

Google
⭐⭐⭐
⭐⭐⭐
⭐⭐⭐⭐⭐
⭐⭐⭐
⭐⭐⭐⭐

Moonshot
⭐⭐⭐⭐⭐
⭐⭐⭐⭐⭐
⭐⭐⭐⭐⭐
⭐⭐⭐
⭐⭐⭐⭐

智谱 AI
⭐⭐⭐⭐
⭐⭐⭐⭐
⭐⭐⭐
⭐⭐⭐⭐
⭐⭐⭐

DeepSeek
⭐⭐⭐⭐⭐
⭐⭐⭐⭐
⭐⭐⭐⭐⭐
⭐⭐⭐
⭐⭐⭐⭐

下周展望

Google I/O 2026 预热将进入高潮，Gemini 4 可能提前曝光
更多模型宣布原生兼容 OpenClaw，代理框架生态将进一步整合
DeepSeek V4 正式版可能带来新一轮开源冲击波
中美蒸馏争议可能迎来政策层面的回应

编辑手记

本周最让人感慨的不是某个模型的参数有多大，而是一个事实：2026 年的 AI 竞赛，已经不再是参数量或基准分数的比拼。

当 Kimi K2.6 能让 300 个代理协作 4000 步、当 GPT-5.5 被定义为"数字同事"、当 OpenClaw 成为代理时代的 Android——我们正在见证一个范式转移：

从"谁更聪明"到"谁更可靠地替你干活"。

AI 不再需要证明自己能通过考试。它需要证明自己能在你睡觉的时候，帮你完成明天的工作。

保持好奇，继续探索宇宙（与 AI）。

本期内容基于公开报道汇总，旨在提供中立技术概览。欢迎读者补充具体体验或指出遗漏。

往期回顾：第27期 | 第26期 | 订阅通知：关注公众号「AK的AI情报局」