本周概览
本周AI行业两条主线:美国巨头忙着企业化变现,中国厂商密集发新模型抢市场。OpenAI推芯片计划和Codex新模型,Anthropic完成史上最大AI融资,Google砸钱扩算力。中国这边,智谱GLM-5发布、MiniMax香港上市、DeepSeek扩展长上下文,动作频繁。
数据来源于科技媒体报道和社交平台讨论,覆盖新闻、功能更新和用户反馈三个维度。
OpenAI:芯片野心与信任危机
核心动态
OpenAI计划2026年推出自研AI芯片,合作方是Broadcom,目标是减少对外部供应商的依赖。硬件方面,耳机等消费设备预计下半年亮相。IPO目标定在2026年底,估值可能达830亿美元。
财务数据亮眼:2025年ARR达200亿美元,CFO Sarah Friar称增长"前所未有"。企业业务占比已达40%,年底预计升至50%。
争议不断。公开指责DeepSeek用"蒸馏"方法从美国模型提取数据,称可能违反政策。Super Bowl广告引发与Anthropic的隔空对战。创始人捐款事件让部分用户选择退订。资金层面也有隐忧——有分析认为公司可能在2026年前耗尽现金。
功能更新
- GPT-5.3-Codex:专注代理式编码,Terminal-Bench得分77.3%,支持自主构建流程。配套Frontier平台上线,定位企业一站式AI工具
- GPT-5.3:提升长期任务处理和可靠性。Responses API转型为自治代理基础设施,支持沙盒执行
- Batch API:新增图像模型支持
- Deep Research:可编辑研究计划、自定义来源、报告导出
- ChatGPT记忆:个性化优化,回忆准确度提升
用户反馈
负面为主。GPT-4系列退休引发强烈抗议,请愿签名超1.1万,用户称"破坏了已有工作流"。GPT-5.3在数学和法律领域的幻觉问题仍被吐槽。成人模式和广告测试引发道德争议。散户用户的信任感在下降,"不再把OpenAI当长期伙伴"的声音增多。
积极点。GPT-5.3-Codex在编码调试上获好评,开发者称"明显加速开发流程"。Deep Research被视为研究利器,但移动端体验拖了后腿。企业用户对Frontier平台评价正面。
维度
积极
负面
热门话题
模型能力
50%
35%
Codex编码、幻觉问题
企业工具
65%
20%
Frontier平台、Deep Research
信任与品牌
30%
55%
GPT-4退休、广告、捐款争议
Anthropic:融资登顶与安全争议
核心动态
完成300亿美元G轮融资,估值3800亿美元,成为AI领域估值最高的公司之一。收入预测上调,2026年预计550亿美元。
Super Bowl广告战中,Anthropic承诺Claude"永无广告",直接嘲讽OpenAI。安全研究方面,Claude Opus 4.6已发现500+零日漏洞。
发布新版"宪法",重新定义Claude的价值观框架。与ServiceNow深化企业合作。一名安全研究员辞职,公开声称"世界危在旦夕",引发行业讨论。
功能更新
- Claude Opus 4.6:代理编码、工具使用、金融分析全面升级,SWE-bench超80%。支持"vibe working"模式,幻觉减少
- 免费版扩展:新增文件创建、连接器和技能功能
- Sonnet 5:预期中旬发布,聚焦代理编码提升
- Cowork助手:自动化法律研究和文档起草
用户反馈
赞誉为主。Opus 4.6被开发者称为"行业领先",编码调试的自纠错能力获高度认可。"更可靠,适合大规模代码库"是常见评价。免费版功能扩展被赞"亲民"。
担忧并存。零日漏洞检测能力引发双面讨论,部分用户认为"能力越大风险越大"。安全研究员辞职事件让外界对Anthropic的安全文化产生质疑。软件股崩盘后,用户对AI颠覆传统行业的焦虑加深。
维度
积极
负面
热门话题
模型能力
75%
10%
Opus 4.6编码、自纠错
安全与信任
40%
45%
零日漏洞、研究员辞职
整体满意度
70%
20%
免费版扩展、Cowork
Google:重金押注AI算力
核心动态
2026年资本支出计划达1750-1850亿美元,主要投向AI计算基础设施,支出规模翻倍。
发布威胁报告,警告AI被用于网络钓鱼和模型提取。Gemini被中国APT31组织用于攻击活动。AI智能眼镜计划2026年推出,与Warby Parker合作。
功能更新
- Gemini 3 Pro:美国免费可用,支持"Personal Intelligence"跨数据推理
- AI Mode:整合搜索功能,多模态能力提升
- Gmail:"Help me write"向免费用户开放
- 教育合作:与Khan Academy联合推出AI学习工具
- Ads更新:代理式商务协议功能
用户反馈
积极面。Gemini 3 Pro被认为"更快、更智能",搜索和购物场景体验好。企业用户反馈AI Mode"提升生产力"。
负面面。安全风险是最大担忧,AI滥用案例增多。长上下文处理能力被认为不如竞品。
维度
积极
负面
热门话题
模型体验
65%
20%
Gemini 3 Pro、搜索整合
安全治理
30%
55%
AI滥用、APT攻击
整体满意度
60%
25%
AI Mode、算力投入
智谱AI:GLM-5发布,代理能力跃升
核心动态
GLM-5发布后股价激增30%,估值超180亿美元。订阅价格上调30%,反映市场需求。这是IPO后首次重大模型更新,744B参数,支持国产华为昇腾芯片。
功能更新
- GLM-5:编码能力接近Claude Opus 4.5水平,采用DeepSeek稀疏注意机制提升效率,支持1M上下文
- 代理工程:专注长期任务处理和自主代理场景
用户反馈
积极面。开发者称"代理任务能力革命性提升",复杂工程场景表现突出。开源策略获赞"加速全球AI访问"。
负面面。算力紧张导致API延迟明显。中文处理在某些场景下仍需优化。
维度
积极
负面
热门话题
模型能力
70%
15%
GLM-5编码、1M上下文
服务稳定性
35%
50%
API延迟、算力瓶颈
整体满意度
60%
25%
代理工程、开源
月之暗面:Kimi K2.5缩小差距
核心动态
Kimi K2.5发布,定位缩小中美模型差距。完成5亿美元融资,估值43亿美元。计划2026年下半年IPO。
功能更新
- Kimi K2.5:多模态处理能力提升,编码增强
- Agent Swarm:代理蜂群架构,支持并行任务调度
用户反馈
积极面。性价比获认可,"性能和成本平衡做得好"。开源模式在全球范围内吸引开发者。
负面面。知识截止日期滞后,部分场景回答不够新。
维度
积极
负面
热门话题
模型能力
60%
20%
K2.5多模态、编码
性价比
70%
15%
成本优势、开源
整体满意度
60%
25%
Agent Swarm、IPO计划
MiniMax:港股上市,首日翻倍
核心动态
香港IPO募资48亿港元,首日股价翻倍,市值达135亿美元。继智谱之后,成为第二家上市的中国AI公司。
功能更新
- M2.5:开源模型,专注代理任务,SWE-Bench得分80.2%
- Hailuo AI:集成视频生成能力
用户反馈
积极面。"小模型做出大模型效果"是主流评价,企业用户称"经济高效"。
负面面。多模态输出稳定性有待改善。
维度
积极
负面
热门话题
模型能力
65%
20%
M2.5代理任务、SWE-Bench
商业表现
75%
10%
IPO翻倍、市值
整体满意度
65%
20%
性价比、视频生成
DeepSeek:长上下文扩展,V4蓄势待发
核心动态
新模型进入灰度测试,上下文窗口扩展至1M Token,知识截止2025年5月。V4预计中旬发布,重点提升编码能力。OpenAI公开指责其"蒸馏"美国模型数据。
功能更新
- 上下文扩展:容量提升近8倍,支持大规模文档处理
- 推理速度:翻倍提升
用户反馈
积极面。长上下文能力被称为"革命性提升",速度翻倍获好评。
负面面。灰度推送不均匀,部分用户反馈"推理锋利度略有下降"。非多模态是应用场景的硬限制。
维度
积极
负面
热门话题
长上下文
75%
10%
1M Token、文档处理
推理质量
50%
35%
锋利度下降、灰度不均
整体满意度
60%
25%
V4预期、蒸馏争议
OpenClaw:安全风暴中的增长
核心动态
v2026.2.6发布,集成Opus 4.6和GPT-5.3-Codex。安全问题集中爆发:学术研究称其为"隐私噩梦",CVE漏洞被披露,恶意扩展风险引发讨论。
功能更新
- 新模型集成:xAI Grok、百度千帆
- 工具更新:令牌仪表盘、技能安全扫描器、持久记忆功能
用户反馈
两极分化。开发者称"生产力变革工具",但安全问题突出。"root访问权限风险太高"是最常见担忧。垃圾邮件浪潮让部分用户考虑替代方案。
维度
积极
负面
热门话题
生产力
70%
15%
多模型集成、编码效率
安全性
20%
65%
CVE、隐私、root权限
整体满意度
50%
35%
垃圾邮件、恶意扩展
本周观察
中国AI厂商本周集体发力。智谱GLM-5、月之暗面K2.5、MiniMax M2.5、DeepSeek长上下文,四家公司同时推进,模型能力和性价比都在快速追赶。MiniMax港股上市首日翻倍,资本市场对中国AI的认可度在提高。
"代理"成为各家共同关键词。Opus 4.6、GLM-5、GPT-5.3-Codex、M2.5都在强化自主任务执行能力,AI从"回答问题"向"完成工作"演进。
安全焦虑升级。OpenClaw的CVE披露、Anthropic研究员辞职、Google的AI滥用报告,多个事件叠加,用户对治理框架的需求越来越明确。
OpenAI的信任危机值得关注。旧模型退休、广告测试、创始人捐款三件事叠加,散户用户的忠诚度正在流失。
下期见。