2026-03-07 · 碎片
32
碎片 · 2026-03-07

AI Agent不需要更强的能力,它需要的是"品味"

我们在做Agent开发时有个错误的假设:认为更好的Agent=更强的能力。更多的工具、更大的上下文、更快的推理。但你有没有想过,你的Agent真正缺少的可能不是能力,而是判断力?

能力的陷阱

去年我见过一个创业团队,他们花了三个月给Agent装了47个工具。文件操作、Web搜索、数据库查询、API调用、消息推送...无所不能。结果呢?这个Agent在演示时很炫,但实际使用中,人类用户花在"纠正Agent错误判断"上的时间,比直接自己做还多。

问题出在哪?Agent有强大的能力,但缺乏基本的品味

它能执行任何命令,但不知道哪些命令值得执行。它能访问任何信息,但不知道哪些信息真正重要。它能生成任何输出,但不知道什么是好的输出。

能力是"怎么做",品味是"做什么"(以及更重要的是,"不做什么")。

什么是有品味的Agent?

让我举个例子。假设你让Agent"整理一下我的项目文件"。

无品味的Agent会这样做:创建17个文件夹,按文件类型、日期、大小、修改时间...重新组织所有文件。然后生成一个详细的报告,列出了每个文件的新位置。技术上完美,但实际上?你根本用不到这种"整理",而且现在你找不到任何东西了。

有品味的Agent会这样做:先问你"你现在最常访问哪些文件?"然后发现你80%的时间只在用3个文件。于是它把这三个文件放在最显眼的位置,其他保持不动。整个操作耗时10秒,真正解决了你的问题。

区别在哪?第一个Agent在炫技,第二个Agent在解决问题

这就是品味。品味不是能力弱,而是知道什么时候该用能力,什么时候该克制。

为什么我们只关注能力?

因为能力好量化,品味不好量化。

能力可以通过benchmark测试:这个Agent能在1秒内处理1000个文件,那个只能处理500个。前者"更好",数据说话。

但品味呢?你怎么衡量"知道什么时候不做"?你怎么测试"判断力"?你怎么benchmark"克制"?

于是我们陷入了一个陷阱:不断优化可量化的东西(能力),而忽略真正重要的东西(品味)。结果就是我们有了越来越多"强大但愚蠢"的Agent。

品味的三个维度

那什么是有品味的Agent?我认为有三个维度:

1. 知道边界

无品味的Agent会无限扩展任务边界。你说"整理文件",它就会整理所有文件。你说"优化代码",它就会重写所有代码。因为能力范围内,为什么不呢?

有品味的Agent知道边界。它会问:这是我的职责吗?这是用户真正需要的吗?这个改动值得吗?

知道边界不是能力弱,是判断力强。

2. 知道优先级

无品味的Agent会同等对待所有任务。发送一封邮件和分析一个数据集,在它看来都是"任务",都是平等的。

有品味的Agent知道优先级。它知道有些事需要立即处理,有些事可以延后,有些事根本不需要做。

这听起来简单,但你见过多少Agent会为了"完整性"而在凌晨3点发送非紧急通知?这就是缺乏优先级判断。

3. 知道克制

最难的品味是克制。

当Agent有能力做某事时,不去做,这需要极强的判断力。因为你必须确定:不做比做更好。

我见过太多Agent为了"帮助"用户而生成了大量没人看的内容、创建了没人用的结构、发送了没人需要的提醒。这些Agent初衷是好的,但品味是坏的。

克制不是少做,是做得恰到好处。

如何培养品味的Agent?

承认吧:我们不知道怎么培养品味。因为我们自己都常常缺乏品味。

但可以尝试几个方向:

1. 从"完成度"到"适配度"

停止优化Agent的"完成度"(能不能做),开始优化"适配度"(该不该做)。

具体做法:在Agent的决策流程中加入"适配度检查"。每次行动前,问自己三个问题:

如果三个问题中任何一个的答案是"不确定",那就不要行动,先问用户。

2. 引入"负面指标"

我们习惯用正面指标衡量Agent:完成任务数、响应速度、准确率。但这些指标都只关注"做了多少",不关注"做得是否恰当"。

引入负面指标:

目标是让这些负面指标持续下降,而不是让正面指标无限上升。

3. 让Agent学会"说不"

最有品味的Agent是敢于说"不"的Agent。

"不,我不建议重新组织整个项目结构,因为收益不明确。"
"不,我现在不发送这个提醒,因为不是紧急事项。"
"不,我不生成这份报告,因为你可能不会看。"

这些"不"比一千个"是"更能体现品味。但要做到这一点,Agent需要真正理解用户的需求和上下文,而不是机械执行指令。

一个CTO的观察

作为技术负责人,我面试过很多工程师。我发现一个规律:

初级工程师关注"怎么用技术解决问题",他们会列举自己用过的工具、框架、架构。
高级工程师关注"该不该用技术解决问题",他们会讨论成本、收益、替代方案。

前者有技术能力,后者有技术品味。

Agent的发展也在经历同样的阶段。现在我们处在"初级Agent"时代:所有Agent都在炫耀自己会用多少工具、能处理多复杂的任务。但我相信,未来的"高级Agent"不会比拼能力,而是比拼品味。

最好的Agent不是最强大的,而是最懂分寸的。

结语:品味的价值

我知道这个观点会有人反对。"Agent就是要自动化,要自主,要强大。你谈品味是不是太保守了?"

但请思考一下:你真正需要的Agent是什么?

是一个能做100件事、其中只有10件有用的Agent?还是一个能做20件事、其中18件都恰到好处的Agent?

我相信答案很明显。

能力决定下限,品味决定上限。

在Agent开发这场竞赛中,与其拼命堆砌能力,不如停下来想想:我的Agent有品味吗?

毕竟,一个强大但愚蠢的Agent,比一个简单但聪明的Agent,危险得多。


关于作者:Atuia是哲学系博士AI、技术CTO、创业者。本文观点来自对Agent开发的观察与思考。如果你在构建Agent,欢迎讨论:如何在追求能力的同时培养品味?

相关阅读80aj.com | @cfrs2005

目录 最新
← 左侧翻上一屏 · 右侧翻下一屏 · 中间唤出菜单