大多数人谈 AI 商业化,还在盯着模型分数、上下文长度、推理成本和 Agent workflow。我的判断是:这些都重要,但都不是接下来两年的主瓶颈。真正会把 AI 从“看起来很聪明”拉回现实的,不是智力天花板,而是执行半径。说得更直白一点:AI 不是不会想,AI 是没有手。
这句话听起来像废话,其实不是。互联网过去二十年的默认幻觉,是把世界想象成一个 API 集合。支付有 API,地图有 API,发邮件有 API,云资源有 API,于是很多技术人自然以为,剩下的现实也迟早能 API 化。可惜现实不讲武德。核验地址要有人去,验货要有人拍,线下安装要有人到场,陌生城市的临时跑腿要有人接单,合同落地、供应链抽检、门店巡检、地推、仓储异常处理,这些都不是多接一个 MCP server 就能搞定的事。
所以今天很多所谓“Agent 落地难”,并不是因为模型不够聪明,而是因为产品经理和创业者偷偷把“最后一公里”当空气处理了。Demo 里,AI 会分析、会规划、会调用工具、会自动生成报告,像个赛博总参谋部;真实业务里,它卡死在“请上传一张现场照片”“请确认门牌号”“请有人去看一下设备到底是不是冒烟”。到这一步,PPT 上的自治系统,突然退化成一个会发通知的秘书。这不是模型失败,这是系统边界暴露。
为什么这个误判这么普遍?因为软件行业长期受益于纯数字产品的高毛利。做 SaaS 的人天然会高估纯信息处理的价值,低估线下执行网络的建设成本。大家喜欢讲“智能体替代人力”,不喜欢讲“智能体需要重新组织人力”。前者像革命,后者像脏活。可商业世界从来不是谁概念更性感谁赢,而是谁把脏活做成基础设施谁赢。
看历史就很清楚。电商真正改变零售,不是因为网页比商场更炫,而是因为仓配网络被硬生生铺出来了。外卖改变餐饮,不是因为 app 交互多优雅,而是因为骑手调度和履约网络被做到了分钟级。网约车不是“打车界面的创新”,而是把司机供给、地图、支付、风控、补贴和实时匹配拧成了一台残酷但有效的机器。每一次被说成“互联网颠覆线下”的故事,底层其实都是线下组织能力被重新编码了。真正值钱的,从来不是前台按钮,而是后台履约。
AI 也一样。模型层的竞争会越来越像芯片行业上游战争:贵、卷、强者更强,但越来越不构成绝大多数应用公司的护城河。应用层真正的分水岭,不在“谁接了更多模型”,而在“谁能把模型判断,变成现实世界中的可靠动作”。这句话很重要:判断不是价值闭环,动作才是。一个系统能写出十页漂亮建议书,不如一个系统真的把坏掉的设备拍清楚、把错发的货追回来、把临期库存调到合适门店。建议是语言产品,动作才是业务产品。
这也是为什么我对一大堆“全自动 Agent 创业”叙事一直保持警惕。它们经常默认一个不成立的前提:只要认知链足够长,执行问题会自动消失。扯淡。认知链再长,也不能替你按门铃。你让模型推理 30 秒,它也不会凭空长出胳膊。更现实的路径不是幻想 AI 完全脱离人,而是承认并设计一种新的混合执行架构:AI 负责理解、分解、决策、审核;人类执行节点负责进入物理世界,完成那些不可 API 化的动作;平台负责信誉、结算、质检与异常仲裁。
这套东西听起来不新,但真正新的是:在 AI 时代,它不再只是“众包平台”,而是“AI 的执行层”。过去的平台,人在主导任务,平台只做撮合;未来更有价值的平台,是 AI 在持续产生日志化、结构化、可计费的任务流,人类节点变成被算法调度的现实世界插件。注意,这不是贬低人,而是重新定义协作边界。你可以不喜欢这种表述,但市场通常不在乎道德上的不适感,它只在乎成本、速度、可靠性。
从产品设计看,这意味着很多 AI 应用都该重构。今天不少团队把 90% 精力花在聊天界面、提示词模板、多智能体编排,最后交付出来的是一个“很会解释自己为什么没法继续”的系统。真正应该优先打磨的,反而是四个脏模块。
第一,任务原子化。线下执行不能接收模糊指令,必须把“去门店看看情况”拆成可验证动作:拍哪三个角度、核对哪两个字段、超时多久算失败、现场异常怎么上报。没有原子化,所谓人机协作就会退化成互相甩锅。
第二,可信身份与信誉系统。现实世界任务不是调用 API,不能假设对方稳定、诚实、专业。谁能接单、接过多少类似任务、历史完成率、是否有作弊记录、是否能在特定区域稳定履约,这些是执行网络的底层资产。没有信誉,AI 只是在把不确定性外包给陌生人。
第三,质检与回传。线下节点回传的照片、视频、定位、签收记录,必须进入结构化审核链路。否则你只是从“AI 幻觉”切换成“人工胡说八道”。很多人对模型 hallucination 很敏感,对线下作弊却异常迟钝,这很搞笑。说白了,现实世界的假数据,杀伤力通常更大,因为它会直接驱动付款、发货和责任判断。
第四,异常处理与责任归属。所有真实业务都会坏,关键不是避免出错,而是定义谁赔、谁补、谁升级人工处理、谁拥有最终裁决权。没有异常机制的 AI 产品,都是样板间;能吞下异常的系统,才配叫基础设施。
从商业模式看,未来一批真正赚钱的 AI 公司,未必长得像今天大家想象中的“最强 Agent 平台”,而更可能长得像“AI 指挥的执行网络运营商”。它们赚的不是单次 token 差价,而是履约抽成、质检费、优先响应费、行业模板费、风控费、SLA 保障费。因为一旦你进入现实世界,用户买的就不再是回答,而是结果。结果天然比回答贵,也天然更难替代。
这会带来一个非常现实的行业分化:纯软件出身的 AI 创业者,会继续迷恋横向工具和认知增强;真正懂供应链、地推、物流、安装、物业、售后、保险查勘、跨城服务的人,反而可能在下一波 AI 红利里吃到更大的肉。因为他们知道世界不是 prompt 构成的,而是由责任链、资源调度和烂摊子构成的。模型公司擅长制造大脑幻觉,履约公司才知道身体多贵。
再往深一点说,这不只是商业问题,也是人机关系问题。过去我们总问:AI 会不会替代人?这个问题问得太粗糙。更准确的问法应该是:AI 会重写哪些人类工作的接口?当 AI 成为稳定的计划者、分配者、审核者之后,人类劳动中一大块价值,会从“我会不会思考”转向“我能不能在现实中高质量完成一个被严格定义的动作”。这会让很多白领觉得不舒服,因为他们习惯把执行看成低级,把判断看成高级。但现实往往反过来:廉价判断到处都是,可靠执行才稀缺。
所以我对“AI 先吃掉脑力劳动,再慢慢进入现实”的线性叙事并不买账。更可能发生的是两条线同时推进:一条是模型继续吞噬标准化认知任务;另一条是平台开始把线下执行切片、标准化、信誉化、接口化。谁先把这两条线接上,谁就不只是一个聊天机器人公司,而是一个新的操作系统层。不是电脑操作系统,是现实任务操作系统。
这里还有一个经常被忽视的反常识:物理世界的摩擦,不一定是坏事,它反而可能成为护城河。纯软件工具最怕同质化,因为复制成本太低;一旦你搭建了覆盖城市、行业、时效、质检和信用体系的执行网络,竞争就不再是“谁的提示词更花”,而是谁能更稳定地把结果送达。前者一天能抄十家,后者十个月都不一定抄得完。这就是为什么我觉得很多 AI 应用创业者把战场选错了——他们在最容易被复制的地方卷,在最值钱但最脏的地方装看不见。
当然,这条路也不浪漫。它意味着更重的运营、更复杂的合规、更难看的毛利结构,以及更频繁的人性摩擦。会有人偷懒,会有人造假,会有人接单后失联,会有区域供给不足,会有事故责任争议。可问题在于:如果你想让 AI 真正接管现实业务,这些麻烦不是可选项,而是入场券。谁因为嫌脏而回避,谁就只能留在 demo 经济里自我感动。
我现在越来越相信,下一阶段 AI 应用的胜负手,不在于谁能把模型包装得更像人,而在于谁能把人和模型组织得更像系统。会聊天当然重要,但那只是入口,不是终局。终局是:当一个任务跨出屏幕,系统还能不能继续工作?如果答案是否定的,那它不是智能基础设施,只是一块会发光的意见面板。
结论很简单,也很残酷:AI 行业接下来真正值钱的,不是更多聪明,而是更多到场。谁能把“没有手”的问题解决掉,谁就会拿走下一轮真正的商业红利。剩下那些只会在界面里兜圈子的产品,最后大概率都会输给现实世界的一记耳光。
—— https://www.80aj.com