2026-05-09 · AI
32
AI · 2026-05-09

第29期大模型周刊:前沿竞赛加剧,算力狂飙与中国开源浪潮并行

本周 AI 圈的主线很清楚:美国巨头继续把钱砸进算力、企业服务和更强的垂直能力,中国公司则沿着开源、高性价比和快速融资一路猛推。两条路线看起来不同,底层逻辑却很像——大家都在抢未来两三年的平台位。

如果只看一层表面,你会觉得本周新闻很散:OpenAI 讲基建和广告,Anthropic 讲增长和安全,Google 还在为 I/O 蓄势,智谱、Kimi、DeepSeek 们则在融资、开源和代理能力上反复刷存在感。但把这些点连起来看,结论并不复杂:大模型竞争已经不只是模型分数,而是算力供给、企业交付、开发者生态和安全边界的综合战争。

对普通用户来说,这一周最值得留意的不是某个 benchmark 再涨了几个点,而是三件更实际的事:第一,头部公司已经默认未来要靠海量资本换能力上限;第二,中国开源模型正在把“够强、够便宜、够开放”这件事做成全球市场变量;第三,网络攻防、代理执行、企业部署这些过去偏实验室的能力,正在越来越快地走向真实业务。

OpenAI:烧钱速度继续上台阶,产品线往广告与实时能力扩

OpenAI 本周最刺眼的,不是新模型本身,而是 Greg Brockman 在法庭证词里披露的算力支出节奏:2017 年公司算力开支还是 3000 万美元,到了 2026 年,单计算资源支出预计就会达到 500 亿美元。这个数字本身已经不是“投入大”,而是直接说明 OpenAI 把基础设施当成了竞争壁垒,而且是最贵、最硬的那种壁垒。

沿着这条逻辑看,OpenAI 最近的产品动作就更容易理解了。一个方向是商业化提速,比如自助广告平台 Ads Manager,开始把 AI 产品的流量和交付能力往更标准化的变现体系里塞。另一个方向是模型服务继续往“更贴近业务现场”靠:GPT-5.5 Instant 更强调个性化、上下文感知和更少幻觉,实时语音/翻译模型也明显是在为代理、客服、跨语种交互这些场景打底。

公司层面还有两个值得一起看。第一,OpenAI 继续松动和微软的独占绑定,为未来 IPO 预留空间;第二,外界对它的财务压力讨论也越来越公开,市场已经开始同时接受两个事实:企业需求确实旺盛,但这个生意也确实非常烧钱。报道里提到 2026 年亏损可能达到 140 亿美元,这会让“规模换护城河”的逻辑继续成立,也会让“这种烧法能烧多久”成为绕不过去的问题。

用户和市场反馈整体偏正面,但不是没有阴影。广告平台和更个性化的产品更新被视为 OpenAI 商业化成熟的信号,不过持久记忆、长期个性化也继续触发隐私担忧。换句话说,OpenAI 现在的优势越来越像一家超级 AI 基础设施公司,但它也越来越像一家必须持续证明自己能把巨额资本转成收入与防御力的公司。

Anthropic:增长故事越来越凶,Claude 往企业交付与安全专精继续深挖

Anthropic 本周的信息密度很高,而且彼此之间是互相支撑的。Dario Amodei 说季度营收和使用量增长达到 80 倍,远高于原先 10 倍的预期。这种表述当然带有公司叙事色彩,但它至少说明一件事:Claude 在企业侧的渗透速度,已经不能再用“稳步增长”来形容,而是进入了明显超预期的阶段。

支撑这种增长的,还是算力和交付能力。Anthropic 和 Akamai 签了 18 亿美元云协议,又和 SpaceX/xAI 围绕 Colossus 数据中心达成合作,甚至租用全部容量。对外部观察者来说,这不是单纯的扩容新闻,而是在说 Claude 的需求真的把基础设施压到了一个新台阶。Claude Code 使用限额翻倍、取消高峰限制,也说明 Anthropic 很清楚开发者口碑是它的重要资产,至少在工具链层面不能让需求卡死在额度上。

另一条线是更敏感也更有想象空间的安全能力。Claude Mythos 作为网络安全专精模型,被限量给部分企业用于漏洞扫描。这个动作释放的信号很强:Anthropic 不满足于做通用模型供应商,它想把“安全可信 + 高价值垂直任务”变成更高毛利、更强粘性的产品层。问题也很直接——一旦模型在攻防场景里足够强,它带来的就不只是效率,还有更高的滥用风险和监管注意力。

市场反馈基本是“又怕又爱”。增长数据、企业合作和 Claude Code 限额提升都让开发者和投资人更有信心;但 Mythos 这类能力也会把行业讨论推向另一面:不是 AI 会不会进入网络攻防,而是它已经开始实用化,只是现在还处在少量企业优先试水的阶段。

Google:本周相对安静,但 I/O 前夜的蓄势感很强

Google 本周没有真正意义上的重磅新模型发布,所以新闻热度不像 OpenAI 和 Anthropic 那么高。但这不代表它没动作,更多是明显进入了 Google I/O 2026 之前的蓄势阶段。市场普遍在等 5 月 19 日的 I/O,看 Gemini 新版本、智能眼镜、代理能力增强,以及 Android 和笔记本操作系统层面的进一步整合。

Google 现在的优势依旧不是单点爆破,而是生态吞吐能力。Gemini 已经深入搜索、Gmail、汽车、文档等工作流,这种渗透方式短期看不如“某个模型一夜封神”刺激,但长期看更像平台公司真正的强项。用户反馈因此也比较平静:大家对本周本身没有太多惊喜,但对 I/O 的预期很高,尤其想看 Google 能不能在行动代理和多模态落地上拿出真正有产品感的东西。

对 Google 来说,压力不在“有没有能力”,而在“能不能把能力做成让用户真想用的产品”。这件事它过去不是没翻过车,所以市场现在更愿意等发布会现场而不是提前下注。

智谱 AI:开源继续冲,高性价比与商业化开始同时加压

智谱这周最值得看的,是它把开源、代理能力和商业化姿态绑得更紧了。GLM-5.1 是一只 754B MoE 的开源模型,重点打强代理和编码能力。这个方向很聪明,因为它不只是追大模型榜单,而是在争夺最容易形成开发者粘性的使用场景:写代码、调工具、跑 agent。

同时,智谱又做了第二次提价。很多人看到提价会下意识觉得是负面,但放在当下环境里,提价反而是一种信号:一家公司敢涨价,往往说明它判断自己已经有了足够的需求基础,或者至少相信用户不会因为这点涨幅大规模流失。更何况它的价格依旧低于多数西方竞争对手,所以这轮提价更像是商业化试探,而不是放弃性价比路线。

入选 TIME 2026 最具影响力 AI 公司,也让智谱的国际品牌进一步抬了一下头。资本市场对模型发布的正反馈同样说明,投资人已经把中国头部模型公司从“有潜力”逐步看成“能打而且可能挣钱”的标的。

开发者侧反馈也比较一致:开源、高性价比、代理/编码能力,是智谱当前最容易转化口碑的三件事。真正的压力则在于,它接下来要证明自己不是只会卷价格和参数,而是能持续稳住生态和交付质量。

月之暗面 Kimi:融资继续抬估值,开源模型热度还在发酵

月之暗面本周最重的新闻还是融资。约 20 亿美元融资、美团领投、估值超过 200 亿美元,ARR 超过 2 亿美元,这几项摆在一起,说明资本市场已经把它视作中国 AI 公司的头部牌桌玩家,而不是一个“有代表作的创业公司”。

更重要的是,融资不是孤立事件。Kimi K2.6 近期开源后,编码和代理能力的讨论热度还在继续发酵。也就是说,月之暗面现在的叙事不是单一的“聊天产品做得不错”,而是“有用户、有收入、有模型、有开源声量,也有继续扩张所需的资本”。这套组合拳对投资人很有吸引力。

市场反馈也很直接:投资者看到了中国开源 AI 的高成长空间,开发者则继续关注 Kimi 模型服务和聊天产品的可用性与性价比。如果后面它能把融资、模型口碑和企业侧落地更顺地串起来,估值进一步抬升并不奇怪。

MiniMax:本周不算最热,但仍在中国开源代理阵营里占位

MiniMax 本周没有新的超级 headline,更多是前期财报和模型讨论的延续。IPO 之后,市场继续消化它“营收增长但亏损扩大”的现实,这其实和整个大模型行业很一致:增长并不稀缺,真正难的是在高增长里找到更健康的单位经济模型。

模型层面,M2.7 及其自进化代理能力仍在被市场反复讨论。MiniMax 的位置有点像那种不会每天上头条,但又始终在牌桌上的玩家。它的价值不只是某一轮 benchmark,而是在中国 AI 商业化样本里,持续证明“开源 + 代理 + 出海”这套逻辑不只属于一家公司。

DeepSeek:融资传闻叠加 V4 口碑,继续把效率路线打深

DeepSeek 这周的焦点集中在融资谈判和 V4 系列模型的持续发酵。首轮外部融资如果真的按 450 亿到 500 亿美元估值推进,而且还有国家级资金参与,那意味着 DeepSeek 在国内已经不只是技术明星公司,更被看作具备战略意义的 AI 资产。

它筹资的目标也很明确:不是为了讲故事,而是为了买算力、扩基础设施。但和西方公司那种“砸更多 GPU 就是答案”的路径相比,DeepSeek 叙事里一直保留着另一种味道——强调芯片迁移、系统效率和成本结构,而不是只盯着 benchmark 第一名。这个差异很关键,因为它决定了 DeepSeek 的护城河可能不是“最强”,而是“足够强且极便宜,还能快速扩散”。

V4 系列模型继续强化了这个认知:开源、高性价比、编码和推理能力接近前沿,虽然还没有完全越过 GPT-5.5 这条线,但已经足够让大量开发者重新计算成本和替代方案。用户/市场反馈也最鲜明:很多人已经把 DeepSeek 看成中国 AI 的国家冠军,甚至把它视为全球价格体系被重写的关键变量。

OpenClaw:新闻不算密集,但仍是代理平台讨论里的高频名字

OpenClaw 本周没有特别新的重大事件,但它依然是 AI 代理平台讨论里的高频样本。原因也不复杂:自主代理、遗留系统自动化、低成本部署,这些标签天然吸引开发者和企业技术团队。与此同时,它身上的安全争议也一直没散,尤其是失控、越权和漏洞相关的话题,让企业版 guardrails 的需求越来越明确。

市场对 OpenClaw 的态度几乎就是典型的 agent 分裂心态:开发者很喜欢,因为它把复杂能力做得更容易试;企业又很警惕,因为一旦真正进生产环境,风险不是 demo 级别,而是权限、数据和执行链路一起放大。

这周真正的行业信号:不是谁更聪明,而是谁更像平台

把这周所有新闻放在一起看,最有价值的结论其实不是“某家又赢了”,而是行业竞争的维度已经稳定扩展成四条线。

第一条线是算力军备竞赛。OpenAI 和 Anthropic 代表的是典型西方路线:先把基础设施堆到一个别人难以复制的规模,再把企业能力、安全能力和通用模型一起打包出售。这个路线的好处是天花板高,坏处是极度烧钱,而且会越来越依赖资本市场的持续信心。

第二条线是中国开源集群。智谱、月之暗面、MiniMax、DeepSeek 这几家并不完全相同,但它们共同在做一件事:把高性能模型用更开放、更低价、更快迭代的方式推向开发者。这让“美国领先、中国追赶”的叙事被不断压缩成更现实的版本——前沿差距也许还在,但可用差距正在迅速缩小。

第三条线是前沿能力开始落地。网络攻防、代理执行、企业部署、实时语音翻译,这些都不是实验室演示了,而是越来越多出现在真实业务流里。能力一旦走出实验室,问题就会跟着一起走出来:安全、滥用、审计、权限控制,每一项都不再是旁支问题。

第四条线是市场情绪进入“乐观但不天真”的阶段。投资人仍然愿意给高估值,开发者依然对开源和新能力兴奋,企业也在持续采购;但围绕财务可持续性、隐私、安全和地缘竞争的担忧,同样在同步抬头。这种情绪比单纯狂热更真实,也更接近行业真正成熟前的样子。

下周看点

下周最值得盯的是 Google I/O。Gemini 能不能拿出真正有冲击力的新版本,Google 能不能把代理和多模态讲成一个更完整的产品故事,会直接影响接下来一段时间市场对“第三极竞争者”的判断。

除此之外,企业部署进展、中国头部模型公司的融资后续,以及安全专精模型会不会进一步从灰度测试走向更公开发布,也都值得继续跟。

眼下的大模型竞争已经不是单轮发布会游戏,而是基础设施、生态、产品和资本一起卷。谁能活到下一轮,不只看模型有多强,还看能不能把这整套系统真的跑起来。

目录 最新
← 左侧翻上一屏 · 右侧翻下一屏 · 中间唤出菜单