
前几天我看到 XinGPT 发了一条视频,标题很直接:为什么 AI 说话总有一股“AI 味”,以及有没有办法一键解决。
这个问题其实很多人都遇到过。你让模型写一段话,它很容易先“稳稳地接住你”,再快速给出一个看上去很完整、很圆润、很安全的结论。句子没错,逻辑也通,但读起来就是不像一个真的人在说话。
这种感觉很难靠一句话解释清楚,因为它不是某个单点 bug。它更像是一整条生成链条共同塑造出来的结果:训练目标、安全对齐、解码策略、训练数据的同质化,最后叠加成了一种很稳定、也很容易被人识别出来的语言气味。
这篇文章不打算把原视频硬翻成逐字稿。原始视频是 X 上的一段 8 分多钟短讲,核心价值在于把“AI 味”从一个模糊感受,拆成几个更具体的机制。下面我按这个思路,把问题重新整理一遍。
“AI 味”到底是什么
很多人一提到“AI 味”,先想到的是词汇层面。比如太爱用“本质上”“值得注意的是”“首先、其次、最后”,或者动不动就把一段话写得四平八稳。但这只是表层。
真正更稳定的特征,通常是下面几种:
- 太快进入结论,几乎不给犹豫和探索留空间
- 语气过于平滑,像把所有棱角都磨掉了
- 总想把复杂问题压缩成一句标准答案
- 很会“接住情绪”,但接得太标准,像训练过的客服
- 段落结构太完整,完整到没有呼吸感
- 很少出现真正的人类写作里那种停顿、转折、保留和局部失衡
所以“AI 味”不是单纯的文风问题。它更像是模型默认的回答姿态:尽量可靠,尽量通用,尽量少冒犯,尽量让人感觉“你已经被很好地服务了”。
问题是,人类写作很多时候恰恰不是这样。真正像人的表达,往往会留下不确定性,会有局部偏执,会带一点个人判断,甚至会有一点多余。
第一层原因:安全训练把模型往“稳妥回答机”推
如果从系统层面看,大模型被训练出来之后,并不是直接拿原始能力上线。它还会经历一整套对齐流程。无论叫 RLHF、SFT,还是更广义的安全训练,目标都很明确:让模型更安全、更稳定、更可控。
这套训练当然有价值。没有这一步,模型更容易胡说八道,也更容易输出危险内容。
但副作用也很明显:模型会学会一套“高通过率”的表达方式。
什么叫高通过率?
就是那种既显得体面,又不太容易出错,还能覆盖大多数用户预期的说法。它会优先组织出一个温和、完整、看起来周全的回答,而不是一个带个人锋芒的表达。久而久之,模型会越来越像一个受过严格职业训练的回答系统。
这也是为什么很多人会感觉 AI 很会“安抚”人。你问它一个问题,它先确认你的感受,再帮你拆解,再给你一套很完整的建议。流程很顺,体验也不差,但越顺越容易让人察觉:这不是自然长出来的话,而是被优化过的沟通动作。
换句话说,安全训练提升了可用性,也顺手制造了一层统一口音。
第二层原因:解码策略天然偏爱“最像正确答案”的句子
就算不考虑安全对齐,模型在真正生成文字时,也会被解码策略继续往“中间值”推。
大多数生成流程,本质上都在做一件事:从一堆可能的下一个 token 里,挑一个最合适的。这里的“合适”,很多时候并不等于“最有个性”,而更接近“最有概率”“最稳定”“最不容易翻车”。
这会带来一个结果:
模型很容易写出统计上最像好答案的句子,而不是最像某个人真实会写出来的句子。
于是你会看到很多文本有这种特点:
- 结构工整
- 修辞克制
- 信息密度平均
- 每一段都在完成任务
- 但没有真正刺人的地方
这就是为什么很多“去 AI 味”的尝试只改词不改机制,最后效果都一般。你把几个高频套话删掉,模型还是会继续沿着高概率、低风险、强收束的轨道往前走。表面换了一层皮,底层的节奏没变。
第三层原因:训练数据越来越像彼此,模型学到的也越来越像彼此
如果说安全训练和解码策略决定了模型怎样开口,训练数据则决定了它长期会形成什么口音。
今天的大模型大量依赖公开互联网文本、整理过的高质量语料、教程、论坛、问答、新闻和各种被筛过的数据集。问题在于,这些文本本身就在不断同质化。
更麻烦的是,互联网内容现在已经在被 AI 反向污染。
有人用 AI 写文章、写摘要、写产品页、写教程,再把这些内容发回网上。下一代模型继续抓这些内容训练,就会学到上一代模型已经加工过的表达方式。这样一轮轮叠上去,结果不是语言越来越丰富,而是某些安全、清晰、标准化的句式越来越占优势。
这件事最危险的地方,不是“机器写得像机器”。而是整个公开文本空间里,越来越多内容都开始往这种风格收敛。等模型再从这里学,出来的结果只会更像模板。
所以很多人以为自己是在讨厌某个模型,其实你讨厌的是一整套越来越工业化的表达分布。
为什么简单改 prompt,经常救不了
不少人第一次意识到“AI 味”之后,会立刻去改提示词。比如加一句:
- 不要太像 AI
- 写得更像真人
- 口语一点
- 少一点套话
- 不要总结腔
这些指令不是完全没用,但通常只能改到表面层。
原因很简单:你是在用一条局部指令,对抗一整条生成链的默认倾向。
模型默认想做的事情,还是:
- 给一个稳定答案
- 保持结构完整
- 控制风险
- 用最容易被接受的语言交付结果
所以真正有效的做法,通常不是一句“更像真人”,而是给模型一个更强的生成约束。比如明确角色、明确写作对象、明确语气边界、明确哪些句式绝对不能出现,甚至直接给一段你认可的语料让它模仿节奏,而不是只模仿主题。
再往前走一步,你甚至需要改工作流,而不是只改 prompt。先让模型产出结构,再单独重写段落;或者先生成粗稿,再让另一个步骤专门做去模板化处理。很多时候,去 AI 味靠的是流程设计,不是神奇咒语。
真正的“去 AI 味”,重点不是装得像人,而是把表达权重重新分配
我自己现在越来越倾向于把“去 AI 味”理解成一件更具体的事:不是让模型假装成人,而是把它从“标准答案机器”拉回到“具体表达工具”。
要做到这一点,至少要动三层。
1. 改任务定义
不要让模型一上来就“给出完整答案”。
很多 AI 味,正是因为任务被定义成了“帮我产出一篇成熟成品”。当任务目标变成成品交付,模型自然会调用最稳妥的写法。
更好的方法是把任务拆开。比如:
- 先列出你真正想保留的判断
- 再写一个粗糙版本
- 最后只改节奏,不改观点
这样模型更像辅助写作者,而不是接管整篇文章的总包商。
2. 改风格约束
风格约束不要写成抽象口号,要写成可执行限制。
比如“不许用‘首先、其次、最后’”“不要替读者下定义”“每段不超过四句”“允许保留犹豫句”“别急着收结论”。这种规则比“写得自然一点”有效得多。
因为前者是操作限制,后者只是审美愿望。
3. 改输入语料
如果你真的想让模型更像某种人类表达,最有效的方法通常不是让它“想象”,而是给它看样本。
不是给它看一堆主题相似的文章,而是给它看你认可的节奏、句长、转折、判断方式。模型对结构和局部风格的模仿,往往比对抽象要求的执行更稳定。
很多人说“我的模型怎么老有 AI 味”,本质上是他给了模型主题,却没有给模型语感。
这类视频真正提醒我们的,不是去掉几个词,而是承认默认输出就是工业化表达
XinGPT 这条视频有意思的地方,不在于指出“AI 味”存在,而在于它把问题往机制上推了一层。
只要模型仍然被激励去生成安全、顺滑、统一、可规模复制的答案,AI 味就不会自然消失。你今天靠 prompt 压下去一点,明天换个场景,它还会回来。
所以更现实的策略不是追求“彻底去味”,而是先判断你到底在哪个场景下受不了这种味道。
如果你是在写客服回复、说明文档、标准 SOP,AI 味不一定是缺点。稳定、清楚、低风险,本来就是目标。
但如果你是在写博客、做内容、写观点、写复盘、写对外表达,问题就变了。此时最值钱的不是“完整”,而是“像你”。这时候你要对抗的就不是几个套话,而是模型默认帮你做掉的一整套工业化包装。
我的补充
我自己现在的经验是,去 AI 味最有效的方式,不是让模型负责“写得像人”,而是让模型负责它真正擅长的那一层:整理、比较、改写、查漏、补结构。
真正决定文章有没有人味的,还是作者自己愿不愿意把判断留在文里。
你可以让模型帮你把材料压缩得更干净,但不要把最后那一层个人语气、犹豫、偏好和取舍也一起外包掉。那一层一旦丢了,剩下的东西再正确,也很容易像批量生产出来的答案。
原视频
https://x.com/xingpt/status/2047088559551660498
你的浏览器不支持 video 标签。
原帖作者:XinGPT🐶(@xingpt)。本文基于公开外链视频做内容整理,并保留原始来源链接。