2026-02-21 · AI
32
AI · 2026-02-21

大模型周刊 第20期 (2026年2月14日-20日)

智能体狂潮:OpenAI"收编"OpenClaw,Claude安防利器震动市场,中国开源多模态再发力

https://www.bigmodel.cn/claude-code?ic=H0RNPV3LNZ

本周概览

本周(2月14-20日),大模型领域进入"智能体+安防+多模态"三线并进阶段。美国巨头聚焦生态整合与防御能力,中国厂商则在开源权重与低成本Agent上持续领跑。OpenClaw创始人加入OpenAI成为最大爆点,Claude Code Security直接让网络安全股蒸发数十亿美元,而Gemini 3.1 Pro、Kimi Claw等新品则让开发者直呼"生产力爆炸"。

数据来源于官方博客、Reuters、VentureBeat、X实时讨论,覆盖新闻、功能更新和用户反馈三个维度。

OpenAI:硬件+智能体双线布局,OpenClaw成最大亮点

核心动态

2月15日,Sam Altman亲自宣布,OpenClaw创始人Peter Steinberger正式加入OpenAI,负责下一代个人Agent开发。OpenClaw项目转为独立开源基金会,OpenAI将继续提供支持。这个开源Agent框架可本地运行、接管电脑执行复杂任务(邮件、文件、Discord等),曾创GitHub百万星标纪录,被誉为"2026年最火个人Agent"。Steinberger在个人博客写道:"I'm joining OpenAI to work on bringing agents to everyone. OpenClaw will move to a foundation and stay open and independent."

2月19日,宣布向英国UK AISI的Alignment Project捐赠750万美元,用于独立AI对齐研究。这是OpenAI在安全领域的最新大动作,此前微软也加入了该联盟。

2月20日,Reuters报道,OpenAI已组建200人团队开发AI硬件家族,首款智能音箱(带摄像头)定价200-300美元,最早2027年发货;后续产品线或涵盖智能眼镜和台灯。

其他:ChatGPT Enterprise在部分企业(如UCSF)于2月17日起逐步推送;老模型退役(GPT-4o等)影响仍在发酵。

用户反馈

OpenClaw"被OpenAI收编"刷屏X平台,开发者狂赞"个人Agent时代真正来了""从vibe coding到全自动工作流"。但也有声音担忧"开源独立性"与隐私(本地运行但权限极高)。部分用户仍为GPT-4o退役请愿(#keep4o),称"新模型快是快,但少了灵魂"。

维度
积极
负面
热门话题

Agent生态
80%
10%
OpenClaw基金会、Steinberger

硬件布局
55%
25%
智能音箱、隐私顾虑

安全投入
60%
20%
Alignment捐赠、GPT-4o退役

Anthropic:Sonnet 4.6 + Code Security,双剑出鞘

核心动态

2月17日,发布Claude Sonnet 4.6,在编码、Agent规划、长上下文、专业办公任务上达到"接近Opus级"表现,计算机使用能力大幅提升。知识截止日期更新至2025年8月,比Opus 4.6(5月)更新。Simon Willison评价其为"Anthropic最有性价比的升级"。

2月20日,限量研究预览推出Claude Code Security——内置Claude Code,可扫描整个代码库找出传统工具漏掉的漏洞。Anthropic官方披露,内部红队已用该工具发现500+生产环境零日漏洞,并自动建议补丁供人工审核。企业/团队用户优先开放,开源维护者可申请加速。

同日澄清消费者条款:禁止第三方工具绕过OAuth使用Claude订阅。

功能更新

用户反馈

Code Security直接"干翻"网络安全股——CrowdStrike、Palo Alto Networks等当日跌幅8-10%,市值蒸发超100亿美元。开发者惊呼"Claude现在不仅是coder,还是安全研究员"。X上热帖称"它会自我辩论验证漏洞,太变态了"。Sonnet 4.6则被赞"性价比之王",但部分用户吐槽上下文清理更激进、"昨天还神,今天突然变笨"。

维度
积极
负面
热门话题

模型能力
75%
10%
Sonnet 4.6性价比、接近Opus

安全工具
85%
10%
Code Security、零日漏洞

行业冲击
40%
50%
安全股暴跌、条款收紧

Google:Gemini 3.1 Pro强化复杂推理

核心动态

2月19日,正式发布Gemini 3.1 Pro(Preview可用),定位"最复杂任务的聪明模型"。继承Gemini 3 Deep Think的强推理能力,支持海量多模态输入(文本/音频/图像/视频/代码仓库),在科学、工程、长时序Agent任务上显著优于Gemini 3 Pro。

已在Vertex AI、企业版、消费者订阅中上线。定价与Gemini 3 Pro一致($2/百万输入,$12/百万输出)。

功能更新

用户反馈

早期试用者称"逻辑和推理强了2倍""1M上下文+视频理解直接干翻竞品"。但也有开发者在X抱怨"Gemini CLI还没支持""创意写作不如前代灵魂""AI Studio偶尔抽风"。整体评价"稳,但还没到惊艳"。

维度
积极
负面
热门话题

推理能力
70%
15%
Deep Think继承、科学工程

多模态
65%
20%
视频理解、1M上下文

整体满意度
60%
25%
CLI支持缺失、创意写作

智谱AI:GLM-5持续发酵,开源Agent工程范式跃迁

核心动态

GLM-5(744B总参/40B激活,2月11-12日发布)虽在上周,但本周影响持续扩大。开源权重、华为Ascend训练、在复杂系统工程与长时序Agent上逼近闭源顶级模型。股票一度大涨30%,被开发者称为"开源Agent工程范式跃迁"。

稀疏注意力机制(借鉴DeepSeek架构)有效控制推理成本,1M上下文窗口让长文档处理与企业Agent场景成为可能。

用户反馈

开发者一致高赞"系统级工程能力吊打很多闭源",代理任务能力被认为是革命性提升。但API延迟和算力瓶颈仍是主要痛点。

维度
积极
负面
热门话题

模型能力
70%
15%
开源权重、Agent工程

服务稳定性
35%
50%
API延迟、算力紧张

整体满意度
65%
20%
华为Ascend训练、范式跃迁

月之暗面:Kimi K2.5 + Kimi Claw,Agent原生生态成型

核心动态

2月17日前后,推出Kimi K2.5开源权重多模态模型——新增视觉能力与Agent Swarm模式,可并行调度100个子Agent,在编码与前端开发任务上对标GPT-5/Gemini。

更大亮点是深度集成OpenClaw,推出原生Kimi Claw浏览器Agent(kimi.com内24/7常驻),支持ClawHub 5000+社区技能、40GB云存储、Bring Your Own Claw(自带本地Agent接入)。这意味着"零硬件跑Agent"正式成为现实。

融资传闻:正以100-120亿美元估值洽谈新一轮,阿里等老股东已承诺7亿美元以上。

功能更新

用户反馈

"OpenClaw + Kimi = 我的24h数字分身,爽到飞起"成为X平台热帖。性价比获广泛认可,开源模式在全球范围吸引大量开发者。但知识截止日期滞后仍是硬伤。

维度
积极
负面
热门话题

Agent生态
80%
10%
Kimi Claw、OpenClaw集成

模型能力
65%
20%
K2.5多模态、Swarm

整体满意度
70%
15%
零硬件Agent、融资

MiniMax:M2.5持续刷屏,极致性价比收割开发者

核心动态

M2.5/M2.5 Lightning(2月12日前后)虽略早,但本周仍在开发者圈高频讨论。MoE架构、SWE-Bench等基准接近SOTA,成本仅Claude Opus的1/20,推理速度100+ tokens/s,被称为"企业24h跑多个Agent只需1万美元/年"。

港股上市后市值稳定在135亿美元附近,投资者情绪保持乐观。

用户反馈

开发者吐槽"从GPT-5 Mini切换到MiniMax后性能起飞","小模型做出大模型效果"是主流评价。企业用户称"经济高效,终于敢让Agent 24h跑代码了"。

维度
积极
负面
热门话题

性价比
85%
5%
1/20成本、100+ t/s

模型能力
65%
20%
SWE-Bench SOTA级

整体满意度
70%
15%
24h Agent、企业落地

DeepSeek:V4悬念持续,社区期待拉满

核心动态

V4(专注编码、百万上下文)传闻2月中旬/春节后发布,本周尚未官宣。但社区期待值已经拉满,X上多帖"DeepSeek这周咋还没动静?美系新模型逼得紧啊"。

上周发布的长上下文扩展(1M Token)持续获得好评,推理速度翻倍提升。

用户反馈

"V4到底什么时候出?"是本周DeepSeek社区最热话题。长上下文能力被认为是"革命性提升",但灰度推送不均匀让部分用户不满。非多模态仍是应用场景的硬限制。

维度
积极
负面
热门话题

长上下文
75%
10%
1M Token、速度翻倍

社区热度
60%
30%
V4悬念、发布延迟

整体满意度
55%
30%
等V4、非多模态限制

本周观察

1. 智能体全面爆发

OpenClaw被OpenAI支持 + Kimi Claw原生集成 + Claude Sonnet 4.6 Agent能力提升,标志着"从聊天到行动"的范式彻底落地。开发者已在用它们搭建"一人公司""全自动营销团队"。2月成为"Agent量产月"。

2. 安防与合规成新战场

Claude Code Security让传统网络安全公司股价大跌,说明AI防御能力已开始反噬传统工具市场。当AI能在数小时内扫描整个代码库并发现零日漏洞,传统扫描器的护城河就不存在了。

3. 中美开源闭源赛跑白热化

中国模型以"开源+极致性价比+Agent原生"抢占开发者心智。GLM-5的系统级工程能力、MiniMax的1/20成本、Kimi Claw的零硬件Agent——三条路径同时冲击美系闭源生态。美国则靠生态(OpenAI硬件+基金会)、安全(Anthropic)和推理(Google)维持优势。

4. 用户真实心声(X精选)

下周看点

DeepSeek V4是否如期落地?OpenAI硬件更多细节?更多厂商跟进Agent安全工具?

本周大模型周刊到此结束。欢迎关注我们,下周继续为你带来最及时、最硬核的AI动态总结!

https://www.aliyun.com/activity/ecs/clawdbot?userCode=693a3his

目录 最新
← 左侧翻上一屏 · 右侧翻下一屏 · 中间唤出菜单