2026-05-15 · AI
32
AI · 2026-05-15

第30期大模型周刊:钱在烧,模型在卷,代理在跑

5 月 9 日到 15 日这一周,大模型这边没什么"平静"可言。

OpenAI 还在为算力账单加杠杆,Anthropic 一边谈估值翻倍一边把云合同签到两千亿,Google 把 Gemini 直接焊死在 Android 上,国内这边智谱、Kimi、DeepSeek、MiniMax 几乎是排着队往外推开源模型。OpenClaw、Hermes 这类自主代理也开始有人真的用起来——既有人喊"生产力翻倍",也有人喊"配置被偷了"。

下面按家拆开看。

OpenAI:账还没算清,IPO 先推迟

CFO Sarah Friar 这周对外说,可能还会继续融资,哪怕刚拿完史上最大一笔私募——超过 220 亿美元。

更扎眼的数字来自 Greg Brockman。他在和 Musk 那场官司的庭上讲,OpenAI 2026 年的算力开销预计要到 500 亿美元。作为对照,2017 年这个数字是 3000 万美元。九年时间,三个零。

钱烧得猛,但增长目标没踩上。10 亿周活的目标没达成,2026 年大概率要亏 140 亿,IPO 也被推到 2027 年。

产品侧动作不少:

和 Apple 的关系据传已经紧张到要打官司的程度。

开发者反馈里,个性化和代理能力被认可,但内存策略一变,隐私这边就有人不爽。我自己的判断是,OpenAI 已经不只是个模型公司了——它在往"全栈业务层"切,广告、应用、入口全要。

Anthropic:估值往九千亿冲,云合同签到两千亿

这一周 Anthropic 在谈一轮 30 到 50 亿的新融资,估值据传可能到 9500 亿美元——上一轮是 3800 亿。如果落地,估值会反超 OpenAI。

更夸张的是云这边的承诺:未来 5 年向 Google Cloud 投入 2000 亿美元。Dario Amodei 自己说需求远超预期,可能要做到 80 倍增长(ARR 已经过 300 亿)。同时和 SpaceX 等签了算力协议。

模型层面,Mythos 这周有更多披露,主要用在漏洞挖掘这类场景,但没全量公开。Claude Code 这套工具链继续在更新。还有一个有意思的动向——Anthropic 在评估收购咨询或工程服务公司,目的是让企业部署能更顺。

开发者反馈很分裂:编码能力和工作流体验被夸,但缓存性能被吐槽得不少;企业那边看重的是代理和安全方向。

Google:Gemini 焊进 Android,I/O 前蓄力

Google 的玩法和前两家不太一样。它不需要重新搞用户入口,因为入口已经在自己手里。

这周更新:

5 月 19 日的 Google I/O 2026 马上要开,新的 Gemini 版本和语音模型基本是板上钉钉。

Android 用户期待的是一个更主动的助手,开发者关心的是多模态嵌入和集成是不是真的省事。Google 这条路有它的好处——不烧广告费就能把模型推到几十亿台设备上。

中国队:融资、开源、代理一起上

这一周中国这边的节奏明显不一样,几家几乎同时出招。

智谱(Zhipu):GLM-5 / GLM-5.1 迭代,开源,编码方向在 SWE-Bench 上领先,代理长任务能力强,支持国产芯片。定价涨了,但已经看齐国际水准,开发者社区还在长。

Moonshot / Kimi:5 月 7 日完成 20 亿融资,估值 200 亿美元,美团领投。Kimi K2.6 开源模型这周成了焦点——编码强、多代理、长上下文。SWE-Bench 上接近甚至超过部分闭源模型,被一些开发者直接喊成"2026 最好的免费编码器之一"。ARR 涨得很快。

DeepSeek:接近首轮融资,估值据传冲到 500 亿。V4 系列继续在编码和数学上打磨。开源路线在海外开发者里口碑不错。

MiniMax:2026 年营收预期 2.19 亿,多模态(视频、语音)发力,IPO 后继续扩张。

横向看一句,中国开源模型在性价比这条线上确实拉得开。本地部署、编码场景,开发者用脚投票。但 Kimi K2.6 这种重模型对硬件要求并不低,本地跑得动也得算清账。

OpenClaw 和 Hermes:代理开始真用起来

这周代理框架这边热度不低。

OpenClaw(自主 AI 代理)和 Hermes(自改进代理,NVIDIA 在背后)都有不少新案例。有人拿它们做设备控制,有人让它跑长任务。GitHub 星标涨得很快。

但安全这条线开始出问题。配置被偷、权限被滥用的案例都有。国内有些机关之前就限制过类似工具的使用。

开发者那边的评价是分裂的:一半人说"游戏改变者",一半人盯着权限模型问"这真的能上生产?"

我的看法是,代理框架现在的状态有点像 2018 年的容器编排——能用,但还没人能保证你用得安全。

这周的几个判断

下周看点很集中:Google I/O、各家代理新动作、中美 AI 节奏的下一回合。

如果你这周也在用某一家的新模型或代理,欢迎告诉我你的体感——尤其是真用在生产里的那种,而不是 demo 里跑得漂亮的那种。

— toy

目录 最新
← 左侧翻上一屏 · 右侧翻下一屏 · 中间唤出菜单