2026-02-13 · AI
32
AI · 2026-02-13

大模型周刊 第19期 (2026年2月7日-13日)

本周概览

本周AI行业两条主线:美国巨头忙着企业化变现,中国厂商密集发新模型抢市场。OpenAI推芯片计划和Codex新模型,Anthropic完成史上最大AI融资,Google砸钱扩算力。中国这边,智谱GLM-5发布、MiniMax香港上市、DeepSeek扩展长上下文,动作频繁。

数据来源于科技媒体报道和社交平台讨论,覆盖新闻、功能更新和用户反馈三个维度。

OpenAI:芯片野心与信任危机

核心动态

OpenAI计划2026年推出自研AI芯片,合作方是Broadcom,目标是减少对外部供应商的依赖。硬件方面,耳机等消费设备预计下半年亮相。IPO目标定在2026年底,估值可能达830亿美元。

财务数据亮眼:2025年ARR达200亿美元,CFO Sarah Friar称增长"前所未有"。企业业务占比已达40%,年底预计升至50%。

争议不断。公开指责DeepSeek用"蒸馏"方法从美国模型提取数据,称可能违反政策。Super Bowl广告引发与Anthropic的隔空对战。创始人捐款事件让部分用户选择退订。资金层面也有隐忧——有分析认为公司可能在2026年前耗尽现金。

功能更新

用户反馈

负面为主。GPT-4系列退休引发强烈抗议,请愿签名超1.1万,用户称"破坏了已有工作流"。GPT-5.3在数学和法律领域的幻觉问题仍被吐槽。成人模式和广告测试引发道德争议。散户用户的信任感在下降,"不再把OpenAI当长期伙伴"的声音增多。

积极点。GPT-5.3-Codex在编码调试上获好评,开发者称"明显加速开发流程"。Deep Research被视为研究利器,但移动端体验拖了后腿。企业用户对Frontier平台评价正面。

维度
积极
负面
热门话题

模型能力
50%
35%
Codex编码、幻觉问题

企业工具
65%
20%
Frontier平台、Deep Research

信任与品牌
30%
55%
GPT-4退休、广告、捐款争议

Anthropic:融资登顶与安全争议

核心动态

完成300亿美元G轮融资,估值3800亿美元,成为AI领域估值最高的公司之一。收入预测上调,2026年预计550亿美元。

Super Bowl广告战中,Anthropic承诺Claude"永无广告",直接嘲讽OpenAI。安全研究方面,Claude Opus 4.6已发现500+零日漏洞。

发布新版"宪法",重新定义Claude的价值观框架。与ServiceNow深化企业合作。一名安全研究员辞职,公开声称"世界危在旦夕",引发行业讨论。

功能更新

用户反馈

赞誉为主。Opus 4.6被开发者称为"行业领先",编码调试的自纠错能力获高度认可。"更可靠,适合大规模代码库"是常见评价。免费版功能扩展被赞"亲民"。

担忧并存。零日漏洞检测能力引发双面讨论,部分用户认为"能力越大风险越大"。安全研究员辞职事件让外界对Anthropic的安全文化产生质疑。软件股崩盘后,用户对AI颠覆传统行业的焦虑加深。

维度
积极
负面
热门话题

模型能力
75%
10%
Opus 4.6编码、自纠错

安全与信任
40%
45%
零日漏洞、研究员辞职

整体满意度
70%
20%
免费版扩展、Cowork

Google:重金押注AI算力

核心动态

2026年资本支出计划达1750-1850亿美元,主要投向AI计算基础设施,支出规模翻倍。

发布威胁报告,警告AI被用于网络钓鱼和模型提取。Gemini被中国APT31组织用于攻击活动。AI智能眼镜计划2026年推出,与Warby Parker合作。

功能更新

用户反馈

积极面。Gemini 3 Pro被认为"更快、更智能",搜索和购物场景体验好。企业用户反馈AI Mode"提升生产力"。

负面面。安全风险是最大担忧,AI滥用案例增多。长上下文处理能力被认为不如竞品。

维度
积极
负面
热门话题

模型体验
65%
20%
Gemini 3 Pro、搜索整合

安全治理
30%
55%
AI滥用、APT攻击

整体满意度
60%
25%
AI Mode、算力投入

智谱AI:GLM-5发布,代理能力跃升

核心动态

GLM-5发布后股价激增30%,估值超180亿美元。订阅价格上调30%,反映市场需求。这是IPO后首次重大模型更新,744B参数,支持国产华为昇腾芯片。

功能更新

用户反馈

积极面。开发者称"代理任务能力革命性提升",复杂工程场景表现突出。开源策略获赞"加速全球AI访问"。

负面面。算力紧张导致API延迟明显。中文处理在某些场景下仍需优化。

维度
积极
负面
热门话题

模型能力
70%
15%
GLM-5编码、1M上下文

服务稳定性
35%
50%
API延迟、算力瓶颈

整体满意度
60%
25%
代理工程、开源

月之暗面:Kimi K2.5缩小差距

核心动态

Kimi K2.5发布,定位缩小中美模型差距。完成5亿美元融资,估值43亿美元。计划2026年下半年IPO。

功能更新

用户反馈

积极面。性价比获认可,"性能和成本平衡做得好"。开源模式在全球范围内吸引开发者。

负面面。知识截止日期滞后,部分场景回答不够新。

维度
积极
负面
热门话题

模型能力
60%
20%
K2.5多模态、编码

性价比
70%
15%
成本优势、开源

整体满意度
60%
25%
Agent Swarm、IPO计划

MiniMax:港股上市,首日翻倍

核心动态

香港IPO募资48亿港元,首日股价翻倍,市值达135亿美元。继智谱之后,成为第二家上市的中国AI公司。

功能更新

用户反馈

积极面。"小模型做出大模型效果"是主流评价,企业用户称"经济高效"。

负面面。多模态输出稳定性有待改善。

维度
积极
负面
热门话题

模型能力
65%
20%
M2.5代理任务、SWE-Bench

商业表现
75%
10%
IPO翻倍、市值

整体满意度
65%
20%
性价比、视频生成

DeepSeek:长上下文扩展,V4蓄势待发

核心动态

新模型进入灰度测试,上下文窗口扩展至1M Token,知识截止2025年5月。V4预计中旬发布,重点提升编码能力。OpenAI公开指责其"蒸馏"美国模型数据。

功能更新

用户反馈

积极面。长上下文能力被称为"革命性提升",速度翻倍获好评。

负面面。灰度推送不均匀,部分用户反馈"推理锋利度略有下降"。非多模态是应用场景的硬限制。

维度
积极
负面
热门话题

长上下文
75%
10%
1M Token、文档处理

推理质量
50%
35%
锋利度下降、灰度不均

整体满意度
60%
25%
V4预期、蒸馏争议

OpenClaw:安全风暴中的增长

核心动态

v2026.2.6发布,集成Opus 4.6和GPT-5.3-Codex。安全问题集中爆发:学术研究称其为"隐私噩梦",CVE漏洞被披露,恶意扩展风险引发讨论。

功能更新

用户反馈

两极分化。开发者称"生产力变革工具",但安全问题突出。"root访问权限风险太高"是最常见担忧。垃圾邮件浪潮让部分用户考虑替代方案。

维度
积极
负面
热门话题

生产力
70%
15%
多模型集成、编码效率

安全性
20%
65%
CVE、隐私、root权限

整体满意度
50%
35%
垃圾邮件、恶意扩展

本周观察

中国AI厂商本周集体发力。智谱GLM-5、月之暗面K2.5、MiniMax M2.5、DeepSeek长上下文,四家公司同时推进,模型能力和性价比都在快速追赶。MiniMax港股上市首日翻倍,资本市场对中国AI的认可度在提高。

"代理"成为各家共同关键词。Opus 4.6、GLM-5、GPT-5.3-Codex、M2.5都在强化自主任务执行能力,AI从"回答问题"向"完成工作"演进。

安全焦虑升级。OpenClaw的CVE披露、Anthropic研究员辞职、Google的AI滥用报告,多个事件叠加,用户对治理框架的需求越来越明确。

OpenAI的信任危机值得关注。旧模型退休、广告测试、创始人捐款三件事叠加,散户用户的忠诚度正在流失。

下期见。

目录 最新
← 左侧翻上一屏 · 右侧翻下一屏 · 中间唤出菜单