第30期大模型周刊：钱在烧，模型在卷，代理在跑

5 月 9 日到 15 日这一周，大模型这边没什么"平静"可言。

OpenAI 还在为算力账单加杠杆，Anthropic 一边谈估值翻倍一边把云合同签到两千亿，Google 把 Gemini 直接焊死在 Android 上，国内这边智谱、Kimi、DeepSeek、MiniMax 几乎是排着队往外推开源模型。OpenClaw、Hermes 这类自主代理也开始有人真的用起来——既有人喊"生产力翻倍"，也有人喊"配置被偷了"。

下面按家拆开看。

OpenAI：账还没算清，IPO 先推迟

CFO Sarah Friar 这周对外说，可能还会继续融资，哪怕刚拿完史上最大一笔私募——超过 220 亿美元。

更扎眼的数字来自 Greg Brockman。他在和 Musk 那场官司的庭上讲，OpenAI 2026 年的算力开销预计要到 500 亿美元。作为对照，2017 年这个数字是 3000 万美元。九年时间，三个零。

钱烧得猛，但增长目标没踩上。10 亿周活的目标没达成，2026 年大概率要亏 140 亿，IPO 也被推到 2027 年。

产品侧动作不少：

Ads Manager 自助广告平台上线，支持 CPM/CPC
GPT-5.5 Instant：更个性化，幻觉据称压下去一截
GPT-Realtime 系列：实时语音和翻译，主要给代理场景用

和 Apple 的关系据传已经紧张到要打官司的程度。

开发者反馈里，个性化和代理能力被认可，但内存策略一变，隐私这边就有人不爽。我自己的判断是，OpenAI 已经不只是个模型公司了——它在往"全栈业务层"切，广告、应用、入口全要。

Anthropic：估值往九千亿冲，云合同签到两千亿

这一周 Anthropic 在谈一轮 30 到 50 亿的新融资，估值据传可能到 9500 亿美元——上一轮是 3800 亿。如果落地，估值会反超 OpenAI。

更夸张的是云这边的承诺：未来 5 年向 Google Cloud 投入 2000 亿美元。Dario Amodei 自己说需求远超预期，可能要做到 80 倍增长（ARR 已经过 300 亿）。同时和 SpaceX 等签了算力协议。

模型层面，Mythos 这周有更多披露，主要用在漏洞挖掘这类场景，但没全量公开。Claude Code 这套工具链继续在更新。还有一个有意思的动向——Anthropic 在评估收购咨询或工程服务公司，目的是让企业部署能更顺。

开发者反馈很分裂：编码能力和工作流体验被夸，但缓存性能被吐槽得不少；企业那边看重的是代理和安全方向。

Google：Gemini 焊进 Android，I/O 前蓄力

Google 的玩法和前两家不太一样。它不需要重新搞用户入口，因为入口已经在自己手里。

这周更新：

Gemini Intelligence：跨 App 自动化任务
免费 Android 升级，包了一些防沉迷工具
Gemini 成了 Android、Chrome、车机的核心 AI 层

5 月 19 日的 Google I/O 2026 马上要开，新的 Gemini 版本和语音模型基本是板上钉钉。

Android 用户期待的是一个更主动的助手，开发者关心的是多模态嵌入和集成是不是真的省事。Google 这条路有它的好处——不烧广告费就能把模型推到几十亿台设备上。

中国队：融资、开源、代理一起上

这一周中国这边的节奏明显不一样，几家几乎同时出招。

智谱（Zhipu）：GLM-5 / GLM-5.1 迭代，开源，编码方向在 SWE-Bench 上领先，代理长任务能力强，支持国产芯片。定价涨了，但已经看齐国际水准，开发者社区还在长。

Moonshot / Kimi：5 月 7 日完成 20 亿融资，估值 200 亿美元，美团领投。Kimi K2.6 开源模型这周成了焦点——编码强、多代理、长上下文。SWE-Bench 上接近甚至超过部分闭源模型，被一些开发者直接喊成"2026 最好的免费编码器之一"。ARR 涨得很快。

DeepSeek：接近首轮融资，估值据传冲到 500 亿。V4 系列继续在编码和数学上打磨。开源路线在海外开发者里口碑不错。

MiniMax：2026 年营收预期 2.19 亿，多模态（视频、语音）发力，IPO 后继续扩张。

横向看一句，中国开源模型在性价比这条线上确实拉得开。本地部署、编码场景，开发者用脚投票。但 Kimi K2.6 这种重模型对硬件要求并不低，本地跑得动也得算清账。

OpenClaw 和 Hermes：代理开始真用起来

这周代理框架这边热度不低。

OpenClaw（自主 AI 代理）和 Hermes（自改进代理，NVIDIA 在背后）都有不少新案例。有人拿它们做设备控制，有人让它跑长任务。GitHub 星标涨得很快。

但安全这条线开始出问题。配置被偷、权限被滥用的案例都有。国内有些机关之前就限制过类似工具的使用。

开发者那边的评价是分裂的：一半人说"游戏改变者"，一半人盯着权限模型问"这真的能上生产？"

我的看法是，代理框架现在的状态有点像 2018 年的容器编排——能用，但还没人能保证你用得安全。

这周的几个判断

资本和现实拉扯：融资喊到 9500 亿，IPO 推到 2027，这两个数字同时存在。
代理是下一个主战场：OpenAI、Anthropic、Google、Kimi、OpenClaw 都在押这个方向，但商业化路径还没真正打通。
中国开源在性价比上有结构性优势：编码场景尤其明显，但生态依然在追赶。
入口仍然值钱：Google 把 Gemini 焊进 Android 这步棋，可能是这一周最被低估的事。

下周看点很集中：Google I/O、各家代理新动作、中美 AI 节奏的下一回合。

如果你这周也在用某一家的新模型或代理，欢迎告诉我你的体感——尤其是真用在生产里的那种，而不是 demo 里跑得漂亮的那种。

— toy