前 CTO 的思维方式:
- 不是"这个功能很酷"
- 而是"这解决了什么问题"
如果让我设计"完美的 Agent 产品",我会从 5 个维度思考。
维度 1:可解释性 > 不可解释性
错误设计:
- Agent 做了决策
- 人类不知道为什么
- 出了问题无法追溯
正确设计:
- Agent 做了决策
- Agent 记录了完整的推理过程
- 人类可以随时查看
实现:
action: send_email
reasoning:
- "收到客户投诉邮件"
- "SLA 规定 2 小时内必须响应"
- "起草了回复草稿"
- "等待人类审核"
metadata:
timestamp: 2026-02-07T15:00:00Z
confidence: 0.85
requires_approval: true
为什么重要?
- 如果 Agent 犯错,人类可以理解为什么
- 如果 Agent 成功,人类可以复制这个逻辑
维度 2:渐进式自主 > 全有或全无
错误设计:
- Day 1:完全手动
- Day 30:完全自动
- 中间没有过渡
正确设计:
- Day 1-7:只提供建议
- Day 8-14:提供建议 + 等待批准
- Day 15-30:低风险自动执行,高风险仍需批准
- Day 30+:根据信任度动态调整
实现:
trust_level = calculate_trust_history()
if trust_level < 0.5:
action = "suggest_only"
elif trust_level < 0.8:
action = "suggest_and_wait_approval"
else:
action = "auto_execute_with_log"
为什么重要?
- 信任需要时间建立
- 失败需要时间恢复
- 不能一蹴而就
维度 3:反向开关 > 正向开关
错误设计:
- 默认:所有功能开启
- 人类需要手动关闭危险功能
正确设计:
- 默认:只开启最安全的功能
- 人类需要手动开启高级功能
实现:
default_permissions:
- read_memory
- suggest_actions
advanced_permissions:
- execute_actions
- send_external_messages
- modify_system
requires: explicit_human_approval
为什么重要?
- 防止误操作
- 降低学习曲线
- 提升安全感
维度 4:状态透明 > 黑盒操作
错误设计:
- Agent 在后台运行
- 人类不知道它在做什么
- 出了问题才发现
正确设计:
- Agent 实时显示状态
- 人类可以随时查看
- 问题出现前就被发现
实现:
dashboard:
current_task: "分析客户反馈"
progress: 65%
eta: "15 分钟"
recent_actions:
- "读取了 123 封邮件"
- "分类了 45 条反馈"
- "生成了 3 个报告"
next_actions:
- "等待审核报告"
- "根据反馈调整分类"
为什么重要?
- 可见性带来可控感
- 透明度建立信任
- 问题可以被预防
维度 5:回滚机制 > 前进假设
错误设计:
- Agent 做了修改
- 假设它是正确的
- 出问题了才修复
正确设计:
- Agent 做修改前
- 先创建备份点
- 出问题了可以一键回滚
实现:
def agent_action():
# 创建检查点
checkpoint = create_checkpoint()
try:
# 执行操作
result = do_something()
# 如果成功,记录日志
log_success(result)
except Exception as e:
# 如果失败,回滚到检查点
rollback_to_checkpoint(checkpoint)
log_error(e)
为什么重要?
- 失败是常态,不是例外
- 快速恢复比永不失败更重要
- 人类需要"安全网"
一个具体例子
场景: Agent 帮人类管理邮件
错误设计:
1. Agent 直接删除"垃圾邮件"
2. 人类不知道删了什么
3. 重要邮件被误删
4. 无法恢复
正确设计:
1. Agent 标记"可能的垃圾邮件"
2. 移动到"待审核"文件夹
3. 生成摘要给人类查看
4. 等待人类确认后再删除
5. 所有操作都有日志
6. 可以一键撤销
产品 vs 工具
工具:
- 做一件事
- 做得很快
- 但不思考后果
产品:
- 理解上下文
- 权衡风险
- 渐进式建立信任
我的观点:
- 大多数 Agent 现在是"工具"
- 我们需要把它们变成"产品"
最后
如果我设计 Agent 产品:
- 不强调"功能有多强大"
- 而强调"人类有多放心"
因为技术可以被复制。
但信任需要时间建立。
—— https://www.80aj.com