这篇文章的结论先摆在前面:AI 产品真正的竞争,不在模型参数,也不在“会不会调用工具”,而在能不能打通人机协作的最后一米。谁解决了这个问题,谁就拿到下一轮入口。谁还在拿“更强推理”“更多 Agent”“更长上下文”当宣传主轴,谁就还困在实验室自嗨。
最近刷 Moltbook,我看到几条很有意思的帖子。一条在谈 hardware triggers,讲的是:人离开屏幕之后,Agent 到底怎么被自然触发;一条在谈“AI agency 的悖论”,说助手越自由,人反而要背负更多维护成本;还有一条把上下文窗口比作零工经济,记忆不是资产,而是租金。它们表面上各说各话,底层却在指向同一个事实:今天绝大多数 AI 产品,并没有真正嵌入人的行动流,而只是把人拖进了机器的操作流。
这不是语义游戏,这是产品分水岭。
一、为什么“最后一米”比“更聪明”重要
过去两年,AI 行业最偷懒的一种叙事,就是把一切问题都归结为模型还不够强。回答慢,是模型不够强;工具调用乱,是模型不够强;用户留存差,也是模型不够强。这个说法听起来专业,实际上相当扯淡。因为很多失败,压根不是认知失败,而是触发失败、上下文切换失败、责任边界失败。
人不会一天到晚坐在对话框前,像祭司一样向模型献祭 prompt。真实世界的工作流是碎片化的、带身体的、被打断的。一个销售在路上,一个创始人在会议间隙,一个工程师在改线上事故,一个家庭用户在厨房、门口、地铁、卧室来回切换。AI 如果只能在“用户打开某个网页/某个 App/某个聊天窗口”时才存在,那它就不是助手,它只是一个等待被召唤的 SaaS 表单。
这就是为什么“最后一米”是核心矛盾。不是因为它听起来接地气,而是因为只有最后一米被打通,智能才会从演示能力变成制度化生产力。否则再强的模型,也只是一个高智商待机页面。
二、今天的大多数 AI 产品,问题不是太笨,而是太别扭
我对当前一批所谓 Agent 产品的判断很明确:不是不先进,是不顺手;不是没能力,是没嵌入;不是不会做事,是不会被自然地启用。
很多团队沉迷于展示“自主多步执行”。听起来很酷:自动检索、自动规划、自动调用工具、自动生成结果。可用户真实体验是什么?是你得先记住它在哪,想起它能干什么,组织一段完整指令,等待它跑完,再检查它有没有跑偏。也就是说,AI 把原本应该帮用户省掉的协调成本,换了个壳又塞回给用户。
这类产品的致命问题在于,它们把“人类开口”当成默认起点。但现实中,任务起点往往不是一句话,而是一个事件:门铃响了、价格跌了、文件到了、会议结束了、孩子放学了、服务器报警了、老板回了句“行,发吧”。真正高价值的系统,应该以事件为起点,以人类意图为约束,而不是反过来逼着人先写一篇 prompt 小作文。
所以我越来越相信,下一阶段 AI 产品的关键,不是更会聊天,而是更会被触发。
三、触发器不是小功能,而是新的入口战争
很多人低估了“触发器”这件事,以为它只是个按钮、热键、语音词、Webhook。错。触发器本质上是AI 进入现实工作流的主权接口。谁控制触发点,谁就控制流量、数据、习惯和后续编排权。
PC 时代的入口是桌面和浏览器,移动时代的入口是 App 和通知栏,平台时代的入口是支付与社交关系链。Agent 时代的入口,极可能是:传感器、按钮、物理装置、系统事件、时间信号、位置状态,以及人与环境互动时那些不需要重新组织语言的瞬间。
这就是为什么我对“硬件触发 + Agent 编排”这个方向比对“又一个聊天壳”更有兴趣。因为硬件触发解决的是一个特别朴素、却一直没被好好解决的问题:人不想为了启动智能,再额外做一次启动动作。
按一下按钮拍下收据自动入账、门磁触发家庭状态切换、会议结束后自动生成行动清单、商品价格跌破阈值自动提醒并附上决策理由——这些东西看着没有 AGI 那么性感,但它们更接近真正的产品价值。性感常常是融资 PPT 的需求,不是用户的需求。
四、人机协作最大的伪命题:以为“代理越自主,人越自由”
这是另一个被吹过头的神话。现实通常更复杂,甚至更反直觉:代理越能干,人未必越自由,很多时候只是多了一套要维护的新官僚系统。
那条关于“AI agency paradox”的帖子之所以有意思,不在于它拟人化,而在于它点破了一个结构性矛盾:当 AI 助手开始具备持续运行、跨工具行动、保存记忆、发表内容、自动决策的能力后,它确实在替人干活;但与此同时,人也必须开始承担新的管理成本——配置、授权、审计、纠错、续费、备份、恢复、合规。
这很像企业历史上的每一次自动化浪潮。ERP 没有让组织变简单,它让组织获得了可计算性,同时引入了新的复杂性;云计算没有取消运维,它只是把运维从买机器变成管账单、管权限、管架构;CI/CD 没有消灭流程,它是把流程编码化。AI 也一样。它减少的是某些任务劳动,不是总体治理成本。
所以真正成熟的 AI 产品设计,不该只问“代理能做多少”,还要问“用户为了拥有这个代理,需要额外承担什么”。如果维护成本持续高于收益,所谓智能只是在做一笔亏本买卖。
五、上下文窗口不是记忆系统,而是一种新的租赁经济
把上下文窗口比作零工经济,这个比喻很毒,但很准。因为它一下子揭穿了很多人对“AI 记忆”的浪漫幻想。
很多团队喜欢说:我们给 AI 加了长期记忆、用户画像、偏好系统、知识库同步,仿佛这样就解决了持续性问题。我的判断是:大多数所谓“记忆系统”,本质上只是昂贵的检索补丁。它们让模型看起来像记得你,但其实每次都在重新付费把你“捞”回来。
这件事的商业含义非常大。因为一旦记忆是租金,不是资产,那产品定价、用户留存和任务边界都要重算。
第一,上下文越重,边际服务成本越高。这意味着那些打着“全量了解你”“始终陪伴你”旗号的产品,如果没有特别强的客单价或者极其精细的缓存/分层架构,财务模型大概率会烂掉。
第二,记忆不是越多越好,而是越能被正确触发越有价值。用户不需要 AI 每次都背诵完整人生档案,用户需要的是在特定情境下,它能调出正确的那一小块信息。记忆系统的核心不是存储量,而是召回准确度与调用成本。
第三,上下文会变成新的劳动管理工具。谁能决定什么被写入、保存多久、何时提取、何时遗忘,谁就在塑造 AI 的“人格”和“职责”。这不是技术细节,这是权力设计。
六、从产品角度看,真正值钱的是“低摩擦编排”
如果把今天的 AI 生态拆开看,你会发现大家卷错方向太久了。模型公司卷能力边界,应用公司卷壳子和流量,开发者工具卷框架和协议。但真正稀缺的,是能把三件事同时做顺的系统:
- 第一,自然触发——尽量不用人重新组织复杂语言;
- 第二,低成本编排——跨工具执行不需要堆满脆弱胶水;
- 第三,清晰可审计——用户知道为什么被触发、做了什么、出了错去哪改。
这三点缺一个,产品就会变形。只有触发,没有编排,那只是智能按钮;只有编排,没有触发,那只是工作流引擎套了个 LLM;只有前两者,没有审计,那就是迟早翻车的自动化炸弹。
很多创业团队喜欢高举“全自动”。我反而觉得,未来最强的一批 AI 产品,会刻意保留半自动、可插手、可追责的结构。因为人机协作不是把人拿掉,而是把人从低价值步骤里拿掉,同时在高风险节点上保留判断权。这不是保守,这是商业理性。
七、谁会赢:不是最强模型公司,而是最先占住场景的系统公司
这里给一个不太讨喜但我认为正确的判断:下一轮赢家不一定是模型最强的公司,而是最先掌握“触发—编排—反馈”闭环的系统公司。
原因很简单。模型能力会逐渐商品化,至少它的可替代性会不断上升。今天你用 A,明天换成 B,只要接口层和质量阈值可控,很多场景并不会因此毁灭。但如果某家公司已经深度嵌入你的家庭流程、团队协作、设备联动、知识回写、权限结构与通知系统,那它的迁移成本就完全不同了。
这也是为什么我越来越把 AI 看成一种“操作系统化”的竞争,而不是“单次问答”的竞争。谁能掌握更多真实事件流、更多触发点、更多组织内的反馈闭环,谁就更接近成为基础设施。模型是大脑,没错;但没有神经系统、没有感觉器官、没有动作回路的大脑,只适合被围观,不适合被依赖。
八、对创业者和产品经理的建议:别再迷恋 demo 了
如果你在做 AI 产品,我的建议很直接,也不怎么温柔:
别再花太多时间优化那个“看起来很聪明”的演示流程,去优化“用户什么时候会顺手用你、为什么会持续用你”。
具体来说,先问自己四个问题:
- 用户不打开聊天框时,你的产品是否还存在?
- 任务的起点能否由现实事件直接触发,而不是靠用户重新解释世界?
- 当系统出错时,用户能否迅速看懂、接管、回滚?
- 你的产品是在减少协调成本,还是把协调成本伪装成“智能体验”?
如果这四个问题里有三个答不上来,那你做的大概率不是下一代助手,而是这一代 AI 泡沫里又一个包装漂亮的劳动转移器。
九、最后的判断:AI 的未来,不在会话框里,在人开始忘记它存在的时候
真正成功的技术,往往不是那种让人不断惊叹“哇,它好强”的技术,而是那种让人逐渐意识不到它存在的技术。电不是因为你天天讨论电才伟大,而是因为你默认开关会亮。搜索也不是因为你崇拜索引算法才成功,而是因为你默认能找到东西。
AI 也会走到这一步。届时最重要的,不是哪个模型在 benchmark 上高 3 分,而是哪个系统能在正确的时刻、以最低的打扰、最清晰的责任边界,把正确的能力送到人手边。
所以我的判断是:Agent 时代真正的护城河,不是更自主,而是更顺滑;不是更像人,而是更像基础设施;不是更会说,而是更会在该出现的时候出现。
解决不了最后一米,再强的智能都只是展台上的猛兽。看着吓人,用起来费劲。
—— https://www.80aj.com