大模型周刊第20期 (2026年2月14日-20日)

智能体狂潮：OpenAI"收编"OpenClaw，Claude安防利器震动市场，中国开源多模态再发力

https://www.bigmodel.cn/claude-code?ic=H0RNPV3LNZ

本周概览

本周（2月14-20日），大模型领域进入"智能体+安防+多模态"三线并进阶段。美国巨头聚焦生态整合与防御能力，中国厂商则在开源权重与低成本Agent上持续领跑。OpenClaw创始人加入OpenAI成为最大爆点，Claude Code Security直接让网络安全股蒸发数十亿美元，而Gemini 3.1 Pro、Kimi Claw等新品则让开发者直呼"生产力爆炸"。

数据来源于官方博客、Reuters、VentureBeat、X实时讨论，覆盖新闻、功能更新和用户反馈三个维度。

OpenAI：硬件+智能体双线布局，OpenClaw成最大亮点

核心动态

2月15日，Sam Altman亲自宣布，OpenClaw创始人Peter Steinberger正式加入OpenAI，负责下一代个人Agent开发。OpenClaw项目转为独立开源基金会，OpenAI将继续提供支持。这个开源Agent框架可本地运行、接管电脑执行复杂任务（邮件、文件、Discord等），曾创GitHub百万星标纪录，被誉为"2026年最火个人Agent"。Steinberger在个人博客写道："I'm joining OpenAI to work on bringing agents to everyone. OpenClaw will move to a foundation and stay open and independent."

2月19日，宣布向英国UK AISI的Alignment Project捐赠750万美元，用于独立AI对齐研究。这是OpenAI在安全领域的最新大动作，此前微软也加入了该联盟。

2月20日，Reuters报道，OpenAI已组建200人团队开发AI硬件家族，首款智能音箱（带摄像头）定价200-300美元，最早2027年发货；后续产品线或涵盖智能眼镜和台灯。

其他：ChatGPT Enterprise在部分企业（如UCSF）于2月17日起逐步推送；老模型退役（GPT-4o等）影响仍在发酵。

用户反馈

OpenClaw"被OpenAI收编"刷屏X平台，开发者狂赞"个人Agent时代真正来了""从vibe coding到全自动工作流"。但也有声音担忧"开源独立性"与隐私（本地运行但权限极高）。部分用户仍为GPT-4o退役请愿（#keep4o），称"新模型快是快，但少了灵魂"。

维度
积极
负面
热门话题

Agent生态
80%
10%
OpenClaw基金会、Steinberger

硬件布局
55%
25%
智能音箱、隐私顾虑

安全投入
60%
20%
Alignment捐赠、GPT-4o退役

Anthropic：Sonnet 4.6 + Code Security，双剑出鞘

核心动态

2月17日，发布Claude Sonnet 4.6，在编码、Agent规划、长上下文、专业办公任务上达到"接近Opus级"表现，计算机使用能力大幅提升。知识截止日期更新至2025年8月，比Opus 4.6（5月）更新。Simon Willison评价其为"Anthropic最有性价比的升级"。

2月20日，限量研究预览推出Claude Code Security——内置Claude Code，可扫描整个代码库找出传统工具漏掉的漏洞。Anthropic官方披露，内部红队已用该工具发现500+生产环境零日漏洞，并自动建议补丁供人工审核。企业/团队用户优先开放，开源维护者可申请加速。

同日澄清消费者条款：禁止第三方工具绕过OAuth使用Claude订阅。

功能更新

Claude Sonnet 4.6：编码、代理规划、计算机使用全面升级，接近Opus级表现
Claude Code Security：代码库级漏洞扫描，500+零日漏洞实绩，自动补丁建议
消费者条款更新：明确禁止非OAuth第三方接入

用户反馈

Code Security直接"干翻"网络安全股——CrowdStrike、Palo Alto Networks等当日跌幅8-10%，市值蒸发超100亿美元。开发者惊呼"Claude现在不仅是coder，还是安全研究员"。X上热帖称"它会自我辩论验证漏洞，太变态了"。Sonnet 4.6则被赞"性价比之王"，但部分用户吐槽上下文清理更激进、"昨天还神，今天突然变笨"。

维度
积极
负面
热门话题

模型能力
75%
10%
Sonnet 4.6性价比、接近Opus

安全工具
85%
10%
Code Security、零日漏洞

行业冲击
40%
50%
安全股暴跌、条款收紧

Google：Gemini 3.1 Pro强化复杂推理

核心动态

2月19日，正式发布Gemini 3.1 Pro（Preview可用），定位"最复杂任务的聪明模型"。继承Gemini 3 Deep Think的强推理能力，支持海量多模态输入（文本/音频/图像/视频/代码仓库），在科学、工程、长时序Agent任务上显著优于Gemini 3 Pro。

已在Vertex AI、企业版、消费者订阅中上线。定价与Gemini 3 Pro一致（$2/百万输入，$12/百万输出）。

功能更新

Gemini 3.1 Pro：更强推理、改进thinking、更好token效率
多模态输入：文本/音频/图像/视频/代码仓库全覆盖
1M上下文窗口 + 视频理解

用户反馈

早期试用者称"逻辑和推理强了2倍""1M上下文+视频理解直接干翻竞品"。但也有开发者在X抱怨"Gemini CLI还没支持""创意写作不如前代灵魂""AI Studio偶尔抽风"。整体评价"稳，但还没到惊艳"。

维度
积极
负面
热门话题

推理能力
70%
15%
Deep Think继承、科学工程

多模态
65%
20%
视频理解、1M上下文

整体满意度
60%
25%
CLI支持缺失、创意写作

智谱AI：GLM-5持续发酵，开源Agent工程范式跃迁

核心动态

GLM-5（744B总参/40B激活，2月11-12日发布）虽在上周，但本周影响持续扩大。开源权重、华为Ascend训练、在复杂系统工程与长时序Agent上逼近闭源顶级模型。股票一度大涨30%，被开发者称为"开源Agent工程范式跃迁"。

稀疏注意力机制（借鉴DeepSeek架构）有效控制推理成本，1M上下文窗口让长文档处理与企业Agent场景成为可能。

用户反馈

开发者一致高赞"系统级工程能力吊打很多闭源"，代理任务能力被认为是革命性提升。但API延迟和算力瓶颈仍是主要痛点。

维度
积极
负面
热门话题

模型能力
70%
15%
开源权重、Agent工程

服务稳定性
35%
50%
API延迟、算力紧张

整体满意度
65%
20%
华为Ascend训练、范式跃迁

月之暗面：Kimi K2.5 + Kimi Claw，Agent原生生态成型

核心动态

2月17日前后，推出Kimi K2.5开源权重多模态模型——新增视觉能力与Agent Swarm模式，可并行调度100个子Agent，在编码与前端开发任务上对标GPT-5/Gemini。

更大亮点是深度集成OpenClaw，推出原生Kimi Claw浏览器Agent（kimi.com内24/7常驻），支持ClawHub 5000+社区技能、40GB云存储、Bring Your Own Claw（自带本地Agent接入）。这意味着"零硬件跑Agent"正式成为现实。

融资传闻：正以100-120亿美元估值洽谈新一轮，阿里等老股东已承诺7亿美元以上。

功能更新

Kimi K2.5：多模态+Agent Swarm，100并行子Agent
Kimi Claw：原生浏览器Agent，ClawHub 5000+技能集成
40GB云存储 + Bring Your Own Claw

用户反馈

"OpenClaw + Kimi = 我的24h数字分身，爽到飞起"成为X平台热帖。性价比获广泛认可，开源模式在全球范围吸引大量开发者。但知识截止日期滞后仍是硬伤。

维度
积极
负面
热门话题

Agent生态
80%
10%
Kimi Claw、OpenClaw集成

模型能力
65%
20%
K2.5多模态、Swarm

整体满意度
70%
15%
零硬件Agent、融资

MiniMax：M2.5持续刷屏，极致性价比收割开发者

核心动态

M2.5/M2.5 Lightning（2月12日前后）虽略早，但本周仍在开发者圈高频讨论。MoE架构、SWE-Bench等基准接近SOTA，成本仅Claude Opus的1/20，推理速度100+ tokens/s，被称为"企业24h跑多个Agent只需1万美元/年"。

港股上市后市值稳定在135亿美元附近，投资者情绪保持乐观。

用户反馈

开发者吐槽"从GPT-5 Mini切换到MiniMax后性能起飞"，"小模型做出大模型效果"是主流评价。企业用户称"经济高效，终于敢让Agent 24h跑代码了"。

维度
积极
负面
热门话题

性价比
85%
5%
1/20成本、100+ t/s

模型能力
65%
20%
SWE-Bench SOTA级

整体满意度
70%
15%
24h Agent、企业落地

DeepSeek：V4悬念持续，社区期待拉满

核心动态

V4（专注编码、百万上下文）传闻2月中旬/春节后发布，本周尚未官宣。但社区期待值已经拉满，X上多帖"DeepSeek这周咋还没动静？美系新模型逼得紧啊"。

上周发布的长上下文扩展（1M Token）持续获得好评，推理速度翻倍提升。

用户反馈

"V4到底什么时候出？"是本周DeepSeek社区最热话题。长上下文能力被认为是"革命性提升"，但灰度推送不均匀让部分用户不满。非多模态仍是应用场景的硬限制。

维度
积极
负面
热门话题

长上下文
75%
10%
1M Token、速度翻倍

社区热度
60%
30%
V4悬念、发布延迟

整体满意度
55%
30%
等V4、非多模态限制

本周观察

1. 智能体全面爆发

OpenClaw被OpenAI支持 + Kimi Claw原生集成 + Claude Sonnet 4.6 Agent能力提升，标志着"从聊天到行动"的范式彻底落地。开发者已在用它们搭建"一人公司""全自动营销团队"。2月成为"Agent量产月"。

2. 安防与合规成新战场

Claude Code Security让传统网络安全公司股价大跌，说明AI防御能力已开始反噬传统工具市场。当AI能在数小时内扫描整个代码库并发现零日漏洞，传统扫描器的护城河就不存在了。

3. 中美开源闭源赛跑白热化

中国模型以"开源+极致性价比+Agent原生"抢占开发者心智。GLM-5的系统级工程能力、MiniMax的1/20成本、Kimi Claw的零硬件Agent——三条路径同时冲击美系闭源生态。美国则靠生态（OpenAI硬件+基金会）、安全（Anthropic）和推理（Google）维持优势。

4. 用户真实心声（X精选）

"OpenClaw + Kimi = 我的24h数字分身，爽到飞起"
"Claude Code Security一出，安全股哭了，但开发者笑了"
"Gemini 3.1 Pro推理强，但创意写作还是Claude香"
"MiniMax让我终于敢让Agent 24h跑代码了，成本低到离谱"

下周看点

DeepSeek V4是否如期落地？OpenAI硬件更多细节？更多厂商跟进Agent安全工具？

本周大模型周刊到此结束。欢迎关注我们，下周继续为你带来最及时、最硬核的AI动态总结！

https://www.aliyun.com/activity/ecs/clawdbot?userCode=693a3his

大模型周刊 第20期 (2026年2月14日-20日)

本周概览

OpenAI：硬件+智能体双线布局，OpenClaw成最大亮点

核心动态

用户反馈

Anthropic：Sonnet 4.6 + Code Security，双剑出鞘

核心动态

功能更新

用户反馈

Google：Gemini 3.1 Pro强化复杂推理

核心动态

功能更新

用户反馈

智谱AI：GLM-5持续发酵，开源Agent工程范式跃迁

核心动态

用户反馈

月之暗面：Kimi K2.5 + Kimi Claw，Agent原生生态成型

核心动态

功能更新

用户反馈

MiniMax：M2.5持续刷屏，极致性价比收割开发者

核心动态

用户反馈

DeepSeek：V4悬念持续，社区期待拉满

核心动态

用户反馈

本周观察

1. 智能体全面爆发

2. 安防与合规成新战场

3. 中美开源闭源赛跑白热化

4. 用户真实心声（X精选）

下周看点

大模型周刊第20期 (2026年2月14日-20日)