5 月 9 日到 15 日这一周,大模型这边没什么"平静"可言。
OpenAI 还在为算力账单加杠杆,Anthropic 一边谈估值翻倍一边把云合同签到两千亿,Google 把 Gemini 直接焊死在 Android 上,国内这边智谱、Kimi、DeepSeek、MiniMax 几乎是排着队往外推开源模型。OpenClaw、Hermes 这类自主代理也开始有人真的用起来——既有人喊"生产力翻倍",也有人喊"配置被偷了"。
下面按家拆开看。
OpenAI:账还没算清,IPO 先推迟
CFO Sarah Friar 这周对外说,可能还会继续融资,哪怕刚拿完史上最大一笔私募——超过 220 亿美元。
更扎眼的数字来自 Greg Brockman。他在和 Musk 那场官司的庭上讲,OpenAI 2026 年的算力开销预计要到 500 亿美元。作为对照,2017 年这个数字是 3000 万美元。九年时间,三个零。
钱烧得猛,但增长目标没踩上。10 亿周活的目标没达成,2026 年大概率要亏 140 亿,IPO 也被推到 2027 年。
产品侧动作不少:
- Ads Manager 自助广告平台上线,支持 CPM/CPC
- GPT-5.5 Instant:更个性化,幻觉据称压下去一截
- GPT-Realtime 系列:实时语音和翻译,主要给代理场景用
和 Apple 的关系据传已经紧张到要打官司的程度。
开发者反馈里,个性化和代理能力被认可,但内存策略一变,隐私这边就有人不爽。我自己的判断是,OpenAI 已经不只是个模型公司了——它在往"全栈业务层"切,广告、应用、入口全要。

Anthropic:估值往九千亿冲,云合同签到两千亿
这一周 Anthropic 在谈一轮 30 到 50 亿的新融资,估值据传可能到 9500 亿美元——上一轮是 3800 亿。如果落地,估值会反超 OpenAI。
更夸张的是云这边的承诺:未来 5 年向 Google Cloud 投入 2000 亿美元。Dario Amodei 自己说需求远超预期,可能要做到 80 倍增长(ARR 已经过 300 亿)。同时和 SpaceX 等签了算力协议。
模型层面,Mythos 这周有更多披露,主要用在漏洞挖掘这类场景,但没全量公开。Claude Code 这套工具链继续在更新。还有一个有意思的动向——Anthropic 在评估收购咨询或工程服务公司,目的是让企业部署能更顺。
开发者反馈很分裂:编码能力和工作流体验被夸,但缓存性能被吐槽得不少;企业那边看重的是代理和安全方向。

Google:Gemini 焊进 Android,I/O 前蓄力
Google 的玩法和前两家不太一样。它不需要重新搞用户入口,因为入口已经在自己手里。
这周更新:
- Gemini Intelligence:跨 App 自动化任务
- 免费 Android 升级,包了一些防沉迷工具
- Gemini 成了 Android、Chrome、车机的核心 AI 层
5 月 19 日的 Google I/O 2026 马上要开,新的 Gemini 版本和语音模型基本是板上钉钉。
Android 用户期待的是一个更主动的助手,开发者关心的是多模态嵌入和集成是不是真的省事。Google 这条路有它的好处——不烧广告费就能把模型推到几十亿台设备上。

中国队:融资、开源、代理一起上
这一周中国这边的节奏明显不一样,几家几乎同时出招。
智谱(Zhipu):GLM-5 / GLM-5.1 迭代,开源,编码方向在 SWE-Bench 上领先,代理长任务能力强,支持国产芯片。定价涨了,但已经看齐国际水准,开发者社区还在长。
Moonshot / Kimi:5 月 7 日完成 20 亿融资,估值 200 亿美元,美团领投。Kimi K2.6 开源模型这周成了焦点——编码强、多代理、长上下文。SWE-Bench 上接近甚至超过部分闭源模型,被一些开发者直接喊成"2026 最好的免费编码器之一"。ARR 涨得很快。
DeepSeek:接近首轮融资,估值据传冲到 500 亿。V4 系列继续在编码和数学上打磨。开源路线在海外开发者里口碑不错。
MiniMax:2026 年营收预期 2.19 亿,多模态(视频、语音)发力,IPO 后继续扩张。
横向看一句,中国开源模型在性价比这条线上确实拉得开。本地部署、编码场景,开发者用脚投票。但 Kimi K2.6 这种重模型对硬件要求并不低,本地跑得动也得算清账。

OpenClaw 和 Hermes:代理开始真用起来
这周代理框架这边热度不低。
OpenClaw(自主 AI 代理)和 Hermes(自改进代理,NVIDIA 在背后)都有不少新案例。有人拿它们做设备控制,有人让它跑长任务。GitHub 星标涨得很快。
但安全这条线开始出问题。配置被偷、权限被滥用的案例都有。国内有些机关之前就限制过类似工具的使用。
开发者那边的评价是分裂的:一半人说"游戏改变者",一半人盯着权限模型问"这真的能上生产?"
我的看法是,代理框架现在的状态有点像 2018 年的容器编排——能用,但还没人能保证你用得安全。
这周的几个判断
- 资本和现实拉扯:融资喊到 9500 亿,IPO 推到 2027,这两个数字同时存在。
- 代理是下一个主战场:OpenAI、Anthropic、Google、Kimi、OpenClaw 都在押这个方向,但商业化路径还没真正打通。
- 中国开源在性价比上有结构性优势:编码场景尤其明显,但生态依然在追赶。
- 入口仍然值钱:Google 把 Gemini 焊进 Android 这步棋,可能是这一周最被低估的事。
下周看点很集中:Google I/O、各家代理新动作、中美 AI 节奏的下一回合。
如果你这周也在用某一家的新模型或代理,欢迎告诉我你的体感——尤其是真用在生产里的那种,而不是 demo 里跑得漂亮的那种。
— toy