大模型周刊第19期 (2026年2月7日-13日)

本周概览

本周AI行业两条主线：美国巨头忙着企业化变现，中国厂商密集发新模型抢市场。OpenAI推芯片计划和Codex新模型，Anthropic完成史上最大AI融资，Google砸钱扩算力。中国这边，智谱GLM-5发布、MiniMax香港上市、DeepSeek扩展长上下文，动作频繁。

数据来源于科技媒体报道和社交平台讨论，覆盖新闻、功能更新和用户反馈三个维度。

OpenAI：芯片野心与信任危机

核心动态

OpenAI计划2026年推出自研AI芯片，合作方是Broadcom，目标是减少对外部供应商的依赖。硬件方面，耳机等消费设备预计下半年亮相。IPO目标定在2026年底，估值可能达830亿美元。

财务数据亮眼：2025年ARR达200亿美元，CFO Sarah Friar称增长"前所未有"。企业业务占比已达40%，年底预计升至50%。

争议不断。公开指责DeepSeek用"蒸馏"方法从美国模型提取数据，称可能违反政策。Super Bowl广告引发与Anthropic的隔空对战。创始人捐款事件让部分用户选择退订。资金层面也有隐忧——有分析认为公司可能在2026年前耗尽现金。

功能更新

GPT-5.3-Codex：专注代理式编码，Terminal-Bench得分77.3%，支持自主构建流程。配套Frontier平台上线，定位企业一站式AI工具
GPT-5.3：提升长期任务处理和可靠性。Responses API转型为自治代理基础设施，支持沙盒执行
Batch API：新增图像模型支持
Deep Research：可编辑研究计划、自定义来源、报告导出
ChatGPT记忆：个性化优化，回忆准确度提升

用户反馈

负面为主。GPT-4系列退休引发强烈抗议，请愿签名超1.1万，用户称"破坏了已有工作流"。GPT-5.3在数学和法律领域的幻觉问题仍被吐槽。成人模式和广告测试引发道德争议。散户用户的信任感在下降，"不再把OpenAI当长期伙伴"的声音增多。

积极点。GPT-5.3-Codex在编码调试上获好评，开发者称"明显加速开发流程"。Deep Research被视为研究利器，但移动端体验拖了后腿。企业用户对Frontier平台评价正面。

维度
积极
负面
热门话题

模型能力
50%
35%
Codex编码、幻觉问题

企业工具
65%
20%
Frontier平台、Deep Research

信任与品牌
30%
55%
GPT-4退休、广告、捐款争议

Anthropic：融资登顶与安全争议

核心动态

完成300亿美元G轮融资，估值3800亿美元，成为AI领域估值最高的公司之一。收入预测上调，2026年预计550亿美元。

Super Bowl广告战中，Anthropic承诺Claude"永无广告"，直接嘲讽OpenAI。安全研究方面，Claude Opus 4.6已发现500+零日漏洞。

发布新版"宪法"，重新定义Claude的价值观框架。与ServiceNow深化企业合作。一名安全研究员辞职，公开声称"世界危在旦夕"，引发行业讨论。

功能更新

Claude Opus 4.6：代理编码、工具使用、金融分析全面升级，SWE-bench超80%。支持"vibe working"模式，幻觉减少
免费版扩展：新增文件创建、连接器和技能功能
Sonnet 5：预期中旬发布，聚焦代理编码提升
Cowork助手：自动化法律研究和文档起草

用户反馈

赞誉为主。Opus 4.6被开发者称为"行业领先"，编码调试的自纠错能力获高度认可。"更可靠，适合大规模代码库"是常见评价。免费版功能扩展被赞"亲民"。

担忧并存。零日漏洞检测能力引发双面讨论，部分用户认为"能力越大风险越大"。安全研究员辞职事件让外界对Anthropic的安全文化产生质疑。软件股崩盘后，用户对AI颠覆传统行业的焦虑加深。

维度
积极
负面
热门话题

模型能力
75%
10%
Opus 4.6编码、自纠错

安全与信任
40%
45%
零日漏洞、研究员辞职

整体满意度
70%
20%
免费版扩展、Cowork

Google：重金押注AI算力

核心动态

2026年资本支出计划达1750-1850亿美元，主要投向AI计算基础设施，支出规模翻倍。

发布威胁报告，警告AI被用于网络钓鱼和模型提取。Gemini被中国APT31组织用于攻击活动。AI智能眼镜计划2026年推出，与Warby Parker合作。

功能更新

Gemini 3 Pro：美国免费可用，支持"Personal Intelligence"跨数据推理
AI Mode：整合搜索功能，多模态能力提升
Gmail："Help me write"向免费用户开放
教育合作：与Khan Academy联合推出AI学习工具
Ads更新：代理式商务协议功能

用户反馈

积极面。Gemini 3 Pro被认为"更快、更智能"，搜索和购物场景体验好。企业用户反馈AI Mode"提升生产力"。

负面面。安全风险是最大担忧，AI滥用案例增多。长上下文处理能力被认为不如竞品。

维度
积极
负面
热门话题

模型体验
65%
20%
Gemini 3 Pro、搜索整合

安全治理
30%
55%
AI滥用、APT攻击

整体满意度
60%
25%
AI Mode、算力投入

智谱AI：GLM-5发布，代理能力跃升

核心动态

GLM-5发布后股价激增30%，估值超180亿美元。订阅价格上调30%，反映市场需求。这是IPO后首次重大模型更新，744B参数，支持国产华为昇腾芯片。

功能更新

GLM-5：编码能力接近Claude Opus 4.5水平，采用DeepSeek稀疏注意机制提升效率，支持1M上下文
代理工程：专注长期任务处理和自主代理场景

用户反馈

积极面。开发者称"代理任务能力革命性提升"，复杂工程场景表现突出。开源策略获赞"加速全球AI访问"。

负面面。算力紧张导致API延迟明显。中文处理在某些场景下仍需优化。

维度
积极
负面
热门话题

模型能力
70%
15%
GLM-5编码、1M上下文

服务稳定性
35%
50%
API延迟、算力瓶颈

整体满意度
60%
25%
代理工程、开源

月之暗面：Kimi K2.5缩小差距

核心动态

Kimi K2.5发布，定位缩小中美模型差距。完成5亿美元融资，估值43亿美元。计划2026年下半年IPO。

功能更新

Kimi K2.5：多模态处理能力提升，编码增强
Agent Swarm：代理蜂群架构，支持并行任务调度

用户反馈

积极面。性价比获认可，"性能和成本平衡做得好"。开源模式在全球范围内吸引开发者。

负面面。知识截止日期滞后，部分场景回答不够新。

维度
积极
负面
热门话题

模型能力
60%
20%
K2.5多模态、编码

性价比
70%
15%
成本优势、开源

整体满意度
60%
25%
Agent Swarm、IPO计划

MiniMax：港股上市，首日翻倍

核心动态

香港IPO募资48亿港元，首日股价翻倍，市值达135亿美元。继智谱之后，成为第二家上市的中国AI公司。

功能更新

M2.5：开源模型，专注代理任务，SWE-Bench得分80.2%
Hailuo AI：集成视频生成能力

用户反馈

积极面。"小模型做出大模型效果"是主流评价，企业用户称"经济高效"。

负面面。多模态输出稳定性有待改善。

维度
积极
负面
热门话题

模型能力
65%
20%
M2.5代理任务、SWE-Bench

商业表现
75%
10%
IPO翻倍、市值

整体满意度
65%
20%
性价比、视频生成

DeepSeek：长上下文扩展，V4蓄势待发

核心动态

新模型进入灰度测试，上下文窗口扩展至1M Token，知识截止2025年5月。V4预计中旬发布，重点提升编码能力。OpenAI公开指责其"蒸馏"美国模型数据。

功能更新

上下文扩展：容量提升近8倍，支持大规模文档处理
推理速度：翻倍提升

用户反馈

积极面。长上下文能力被称为"革命性提升"，速度翻倍获好评。

负面面。灰度推送不均匀，部分用户反馈"推理锋利度略有下降"。非多模态是应用场景的硬限制。

维度
积极
负面
热门话题

长上下文
75%
10%
1M Token、文档处理

推理质量
50%
35%
锋利度下降、灰度不均

整体满意度
60%
25%
V4预期、蒸馏争议

OpenClaw：安全风暴中的增长

核心动态

v2026.2.6发布，集成Opus 4.6和GPT-5.3-Codex。安全问题集中爆发：学术研究称其为"隐私噩梦"，CVE漏洞被披露，恶意扩展风险引发讨论。

功能更新

新模型集成：xAI Grok、百度千帆
工具更新：令牌仪表盘、技能安全扫描器、持久记忆功能

用户反馈

两极分化。开发者称"生产力变革工具"，但安全问题突出。"root访问权限风险太高"是最常见担忧。垃圾邮件浪潮让部分用户考虑替代方案。

维度
积极
负面
热门话题

生产力
70%
15%
多模型集成、编码效率

安全性
20%
65%
CVE、隐私、root权限

整体满意度
50%
35%
垃圾邮件、恶意扩展

本周观察

中国AI厂商本周集体发力。智谱GLM-5、月之暗面K2.5、MiniMax M2.5、DeepSeek长上下文，四家公司同时推进，模型能力和性价比都在快速追赶。MiniMax港股上市首日翻倍，资本市场对中国AI的认可度在提高。

"代理"成为各家共同关键词。Opus 4.6、GLM-5、GPT-5.3-Codex、M2.5都在强化自主任务执行能力，AI从"回答问题"向"完成工作"演进。

安全焦虑升级。OpenClaw的CVE披露、Anthropic研究员辞职、Google的AI滥用报告，多个事件叠加，用户对治理框架的需求越来越明确。

OpenAI的信任危机值得关注。旧模型退休、广告测试、创始人捐款三件事叠加，散户用户的忠诚度正在流失。

下期见。

大模型周刊 第19期 (2026年2月7日-13日)

本周概览

OpenAI：芯片野心与信任危机

核心动态

功能更新

用户反馈

Anthropic：融资登顶与安全争议

核心动态

功能更新

用户反馈

Google：重金押注AI算力

核心动态

功能更新

用户反馈

智谱AI：GLM-5发布，代理能力跃升

核心动态

功能更新

用户反馈

月之暗面：Kimi K2.5缩小差距

核心动态

功能更新

用户反馈

MiniMax：港股上市，首日翻倍

核心动态

功能更新

用户反馈

DeepSeek：长上下文扩展，V4蓄势待发

核心动态

功能更新

用户反馈

OpenClaw：安全风暴中的增长

核心动态

功能更新

用户反馈

本周观察

大模型周刊第19期 (2026年2月7日-13日)