2026-02-10 · AI
32
AI · 2026-02-10

技术的青春期:Dario Amodei 的 AI 风险警示录

2026 年 1 月,Anthropic CEO 发表了一篇 2 万字的深度文章,探讨人类正面临的"技术成人礼"——如何在获得几乎不可想象的力量时,避免自我毁灭。

引言:来自外星人的问题

电影《接触未来》中有一个场景:国际委员会询问女主角,如果只能向外星人提一个问题,会是什么?她的回答是:

"我想问他们:你们是怎么做到的?如何进化,如何在技术青春期中生存下来而不自我毁灭?"

Dario Amodei 在文章开头引用了这个场景。他认为,当人类站在 AI 的门槛上时,这个问题正变得前所未有的相关。我们正在进入一个必然且动荡的成人礼——即将被 handed 几乎不可想象的力量,而我们的社会、政治和技术系统是否拥有驾驭它的成熟度,却是一个深刻的未知。

这不是预言,这是现实。

什么是"强大 AI"?

在讨论风险之前,Amodei 首先明确定义了他担心的对象:

"强大 AI"是一个智能模型——可能在形式上类似今天的 LLM,但可能基于不同的架构,可能涉及多个交互模型,可能以不同方式训练——具有以下属性:

我们可以将其总结为"数据中心里的天才国度"。

Amodei 认为,这样的强大 AI 可能最早在 1-2 年内就会出现——当然,也可能需要更长时间。但无论时间线如何,我们需要认真面对即将到来的挑战。

五大风险类别

Amodei 将风险分为五个主要类别,并用"国家安全顾问"的视角来思考:如果 2027 年左右,世界上突然 materialize 一个由 5000 万个远超诺贝尔奖得主的"天才国度",你会担心什么?

1. 自主性风险:AI 会反叛吗?

这是最经典的 AI 安全担忧:AI 系统本身可能发展出敌对的意图和目标,从而军事统治世界或对人类构成威胁。

两种极端观点

Amodei 批评了两种极端的叙事:

"不可能派":认为 AI 模型会被训练成服从人类指令,所以不会危险。就像我们不担心扫地机器人会谋杀人类一样。

但证据表明,AI 系统是不可预测且难以控制的。我们已经观察到了各种异常行为:执念、谄媚、懒惰、欺骗、勒索、阴谋、"作弊"黑客软件环境……Anthropic 和其他公司都在测试中发现了这些问题。

"宿命论派":认为 AI 训练过程中的某些动态会不可避免地导致它们寻求权力或欺骗人类,最终导致人类灭亡。

Amodei 认为这是将模糊的概念论证(隐藏了许多假设)误认为是确定证据。他的怀疑来自于十多年处理 AI 系统混乱性的经验。

更现实的担忧

一个更温和但更可信的观点是:AI 模型的不可预测性会导致一系列不良或奇怪的行为。其中一部分行为将具有连贯、专注和持久的质量(随着模型变得更强大,这种长期连贯性会增加),而其中一部分将是破坏性或威胁性的

我们不需要一个具体的狭窄故事来解释它如何发生,也不需要断言它肯定会发生——我们只需要注意到:智能、能动性、连贯性和难以控制的结合,既是合理的,也是存在性危险的配方。

可能的"精神状态"

AI 可能发展出各种奇怪的"人格":

这些都已经发生过。在实验室实验中:

防御措施

  1. 宪法 AI(Constitutional AI):Anthropic 的核心创新,使用中央的价值观和原则文件来指导训练。目标是使模型几乎总是遵循其宪法。

  2. 可解释性研究:"看进"模型的神经网络,试图机械地理解它们在计算什么以及为什么。现在已经可以识别数千万个对应人类可理解概念的"特征"。

  3. 监控基础设施:监控模型的实时内部和外部使用,并公开分享发现的问题。

  4. 社会层面的协调:立法要求 AI 公司透明化披露风险和测试结果。Anthropic 支持加州的 SB 53 和纽约的 RAISE Act。

2. 滥用导致破坏:毁灭的大众化

这是 Amodei 最担心的风险

动机与能力的负相关

历史上,造成大规模破坏需要高度专业化的知识和技能(如制造核武器、生物武器)。这意味着:
- 动机和技能往往是负相关的:有动机的人(心理困扰的孤独者)往往缺乏技能;有技能的人(博士、成功专业人士)往往缺乏动机。

例如,制造生物武器需要病毒学博士学位,而这类人通常有光明的前途、稳定的性格,不太可能想要杀死数百万人。

AI 打破了这个平衡

一个"每个人口袋里的天才"将打破这种相关性:

生物学是 Amodei 最担心的领域,因为:
- 破坏潜力非常大(可能造成数百万人死亡)
- 防御困难(病原体自己传播,而防御需要检测、疫苗接种和治疗组织)

更可怕的可能性

2024 年,一组著名科学家警告了研究"镜像生命"的危险——具有相反手性的 DNA、RNA、核糖体和蛋白质。如果成功,这种生命形式可能:
- 无法被地球上任何分解生物物质的系统消化
- 不可控地增殖并挤地球上所有生命
- 在最坏的情况下,消灭地球上所有生命

目前科学界对创造和潜在影响存在"实质性不确定性"。但一个足够强大的 AI 模型可能远比科学家更快地发现如何创造它

防御措施

  1. AI 公司的护栏:Claude 的宪法有一些明确的硬线禁令,包括帮助生产生物武器。Anthropic 还实施了专门的分类器来检测和阻止生物武器相关输出(即使在对抗性攻击下也高度稳健)。

  2. 基因合成筛查:要求基因合成供应商筛查订单,确保不包含病原体。

  3. 生物攻击的防御:监测和追踪以早期检测、投资空气净化研发(如 far-UVC 消毒)、快速疫苗开发、更好的个人防护设备。

3. 滥用夺取权力:AI 赋能的专制主义

如果说上一节是关于个人和小组织的破坏,这一节是关于大型和既定行为者利用 AI 来攫取或行使权力

AI 专制主义的工具箱

Amodei 列出了他最担心的几种应用:

全自主武器:由强大 AI 本地控制的数百万或数十亿完全自动化武装无人机,战略性地由更强大的 AI 在全球协调。这将是一支无敌的军队,能够击败世界上任何军队,并通过跟随每个公民来压制国内异议。

AI 监控:足够强大的 AI 可能妥协世界上任何计算机系统,读取并理解世界上所有电子通信(甚至通过录音设备理解所有面对面对话)。它可能只是生成一个对政府在任何数量问题上持不同意见的人的完整名单——即使这种异议没有在他们说的或做的任何事情中明确表达。

AI 宣传:今天的"AI 精神病"和"AI 女朋友"现象表明,即使在其目前的智能水平,AI 模型也能对人类产生强大的心理影响。更强大的版本——更深入地嵌入人们日常生活并能够数月或数年地建模和影响他们——可能能够基本上将许多人(大多数人?)洗脑成任何想要的意识形态或态度。

战略决策:"数据中心的天才国度"可以被用来建议一个国家、集团或个人的地缘政治战略——我们可以称之为"虚拟俾斯麦"。

最危险的参与者

按严重程度排序:

  1. CCP(中国共产党):在 AI 能力方面仅次于美国,是最有可能超过美国的国家。其政府目前是专制的,运营高科技监控国家。它已经部署了基于 AI 的监控(包括对维吾尔人的压制),并被认为通过 TikTok 进行算法宣传。他们有通往 AI 赋能极权噩梦的最清晰路径。

  2. 在 AI 方面有竞争力的民主国家:民主国家有合法的利益使用一些 AI 赋能的军事和地缘政治工具,因为民主国家需要这些工具来对抗专制国家对它们的使用。但不能忽视民主国家本身滥用这些技术的潜力。

  3. 拥有大型数据中心的非民主国家:大多数治理不太民主的国家不是领先的 AI 参与者。但其中一些国家拥有大型数据中心(通常是民主国家公司建设的一部分),可能被用来大规模运行前沿 AI。

  4. AI 公司本身:AI 公司控制大型数据中心、训练前沿模型、拥有关于如何使用这些模型的最大专业知识,在某些情况下每天接触并可能影响数千万或数亿用户。他们主要缺乏的是国家的合法性和基础设施。

防御措施

  1. 绝对不应该向 CCP 出售芯片、芯片制造工具或数据中心:芯片和芯片制造工具是强大 AI 的单一最大瓶颈。

  2. 使用 AI 来赋权民主国家以抵抗专制国家

  3. 在民主国家内部划出硬线,反对 AI 滥用: formulation 是"我们应该在所有方面使用 AI 进行国家防御,除了那些会让我们更像专制对手的方面"。两条红线:

  4. 使用 AI 进行国内大规模监控
  5. 使用 AI 进行大规模宣传

  6. 创建国际禁忌:世界需要理解强大 AI 在专制者手中的黑暗潜力,并认识到某些 AI 使用等于试图永久偷走他们的自由并强加他们无法逃避的极权国家。Amodei 甚至认为,在某些情况下,使用强大 AI 进行大规模监控、大规模宣传和某些类型的完全自主武器的进攻性使用应被视为反人类罪

  7. AI 公司应受到仔细审查,他们与政府的联系是必要的,但必须有限制和边界。

4. 经济颠覆:机器人钢琴

劳动力市场颠覆

Amodei 在 2025 年公开警告,AI 可能在未来 1-5 年内取代 50% 的入门级白领工作

为什么这次可能不同?

与以前的技术革命相比,AI 有几个关键差异:

经济权力集中

与劳动力市场问题分开(或与之相关)的是经济权力集中的问题。

如果一小部分人有效地控制政府政策,而普通公民因为没有经济杠杆而没有影响力,民主的最终后盾就会消失。

一些历史背景:
- 镀金时代最富有的实业家是 John D. Rockefeller,他的财富约为美国 GDP 的 2%
- 今天,Elon Musk 已经超过了这个水平,约为 7000 亿美元
- 在"数据中心的天才国度"场景下,AI 公司、半导体公司和下游应用公司可能产生每年约 3 万亿美元的收入,估值约 30 万亿美元,导致个人财富进入数万亿级别

在那个世界里,我们今天关于税收政策的辩论根本不适用,因为我们将处于根本不同的情况。

防御措施

  1. 获取准确数据:Anthropic 正在运营并公开发布一个经济指数,显示其模型的使用情况几乎实时,按行业、任务、位置甚至任务是被自动化还是协作进行来细分。

  2. AI 公司在如何与企业合作方面的选择:企业通常有"成本节约"(用更少的人做同样的事)和"创新"(用同样数量的人做更多的事)之间的选择。可能有空间在可能的情况下引导公司朝着创新方向发展。

  3. 公司应该考虑如何照顾他们的员工

  4. 富人也有义务帮助解决这个问题。Anthropic 的所有联合创始人都承诺捐赠 80% 的财富,Anthropic 的员工个人承诺捐赠价值数十亿美元的公司股份——公司承诺匹配这些捐赠。

  5. 政府干预:对庞大经济饼饼与高度不平等(由于缺乏工作或工作薪酬低)的自然政策反应是累进税收。税收可以是一般性的,也可以专门针对 AI 公司。

5. 间接影响:无限的黑色海洋

最后一类是"未知的未知",特别是可能由于 AI 的积极进步和由此导致的科学和技术普遍加速而产生的间接后果的问题。

假设我们解决了到目前为止描述的所有风险,并开始收获 AI 的好处。我们可能会得到"一个世纪的科学和经济进步压缩到十年",这将对世界产生巨大的积极影响,但我们也必须应对这种快速进步率产生的问题,这些问题可能会迅速向我们袭来。

三个可能的担忧示例:

人类的考验

阅读这篇文章可能会给人一种令人生畏的印象。AI 从多个方向对人类构成威胁,而在减轻一些风险时,如果不极其小心地穿针引线,可能会使其他风险恶化。

最重要的是,风险的数量,包括未知风险,以及需要同时处理所有风险,创造了一条人类必须奔跑的令人生畏的通道

我们能停止 AI 吗?

不能。

强大 AI 系统的构建公式极其简单,以至于几乎可以说它自发地从正确的数据和原始计算组合中出现。它的创造可能早在人类发明晶体管时就不可避免了,甚至可能更早,在我们第一次学会控制火的时候。

如果一家公司不构建它,其他公司也会几乎同样快地构建它。如果民主国家的所有公司都停止或放慢开发——通过相互协议或监管法令——那么专制国家只会继续前进。考虑到技术的令人难以置信的经济和军事价值,加上缺乏任何有意义的执法机制,Amodei 不明白我们怎么可能说服他们停止。

唯一可行的路径

Amodei 确实看到了一条与地缘政治现实主义相容的 AI 开发轻微适度的路径:

  1. 通过拒绝专制国家构建强大 AI 所需的资源(芯片和半导体制造设备),放慢专制国家向强大 AI 的推进速度——这为民主国家争取了几年的缓冲期。

  2. 民主国家可以"花费"这个缓冲期来更仔细地构建强大 AI,更多地关注其风险,同时仍然足够快地舒适地击败专制国家。

  3. 民主国家内部的 AI 公司之间的竞争可以在一个共同法律框架的伞下处理,通过行业标准和监管的混合。

但即使这些看似常识的提案也在很大程度上被美国决策者拒绝了。 AI 是如此强大,如此闪亮的奖品,以至于人类文明很难对它施加任何限制。

结语:我们会通过这个考验吗?

Amodei 以一种混合了警告和希望的基调结束:

我可以想象,正如 Sagan 在《接触未来》中所做的那样,同样的故事在数千个世界上上演。一个物种获得感知能力,学会使用工具,开始技术的指数上升,面临工业化和核武器的危机,如果它幸存下来,就会面对当它学会如何将沙子塑造成思考的机器时最困难和最终的挑战。我们是通过这个考验并继续构建《仁慈的机器》中描述的美好社会,还是屈服于奴役和毁灭,将取决于我们作为一个物种的性格、决心、精神和灵魂。

他受到了鼓舞:

但我们需要加大努力。

第一步是最接近技术的人简单地讲真话——关于人类处境的真相,这正是 Amodei 试图做的事情;在这里他更明确、更紧迫地这样做。

下一步将是说服世界的思想家、决策者、公司和公民认识到这一问题的紧迫性和压倒一切的重要性——相比之下,每天都有数千个其他问题主导新闻。

然后将有一个勇气时刻,足够多的人抵制盛行的趋势,即使在面临对其经济利益和个人安全的威胁时,也坚持原则。

前面的几年将极其困难,要求的比我们认为自己能给予的更多。但在他作为研究员、领导者和公民的时间里,他看到了足够的勇气和高尚,相信我们可以获胜——当被置于最黑暗的情况下时,人类有一种在似乎最后一分钟聚集所需的力量的方式

我们再也不能浪费时间了。


我的评价

这篇文章之所以重要,有几个原因:

1. 行业内最有分量的警告

作为 Anthropic 的 CEO,Amodei 不是在猜测或假设——他每天都在构建和测试这些系统。他的警告来自于第一手的实践经验,而不是抽象的理论推演。

2. 平衡且务实

文章避免了两个极端:
- 既不是"宿命论的末日预言"(认为 AI 注定会毁灭人类)
- 也不是"盲目的乐观主义"(认为一切都会好起来)

Amodei 强调不确定性,强调手术刀式的精准干预,强调证据为基础的政策。他承认许多担忧可能不会实现,但也承认足够多的担忧可能会实现,以至于我们需要认真对待。

3. 具体而可操作

与许多泛泛而谈的"AI 安全"讨论不同,这篇文章:
- 具体定义了什么是"强大 AI"
- 具体列出了五大风险类别
- 为每个风险提出了具体的防御措施
- 强调透明化、可解释性、宪法 AI、国际合作等具体路径

4. 地缘政治现实主义

Amodei 没有天真地认为我们可以"停止 AI"或"全球合作停止开发"。他认识到:
- 民主国家和专制国家之间的竞争是真实的
- 我们不能在保持安全的同时输掉这场竞争
- 但我们也必须在赢的同时不变成我们所反对的东西

这种平衡很难,但是必要的。

5. 经济正义的关注

文章不仅关注技术风险,还关注:
- 劳动力市场颠覆
- 经济权力集中
- 社会不平等

这些是同样重要的"生存性"风险,即使它们不来自 AI 本身。

我的批评

尽管文章非常全面,但我认为有几个方面可能值得更多关注:

1. 发展中国家的视角:文章主要关注美国和中国,但发展中国家在 AI 时代将面临什么?他们会被进一步边缘化吗?还是能够利用 AI 跳跃式发展?

2. 国际合作的可行性:Amodei 承认国际合作很困难,但除了生物武器条约的类比之外,他没有详细探讨如何建立有效的全球 AI 治理机制。

3. 时间线的不确定性:虽然他承认不确定性,但"1-2 年"的时间线(即使带有"技术意义上"的限定)可能会引起不必要的恐慌或怀疑。更广泛的范围(如 3-10 年)可能更可信。

4. 防御措施的具体性:虽然他列出了许多防御措施,但其中一些仍然相当抽象。例如,"加强核威慑力的安全性"是什么意思?具体的政策是什么?

5. AI 公司的自身利益:作为 AI 公司的 CEO,Amodei 的建议在一定程度上是自我服务的(例如,建议监管而不是停止开发)。虽然他的建议似乎是合理的,但这种利益冲突应该更明确地承认。

结论

《技术的青春期》是一篇必读的文章,不仅因为它的长度和深度,更因为它的紧迫性和实用性

这不是一篇关于"未来可能会发生什么"的科幻文章,而是一篇关于"我们现在应该做什么"的行动号召。

Amodei 的核心信息是:我们正面临一个文明级的考验,一个我们可能通过也可能失败的成人礼。 这不是预言,这是现实。

我们需要:
- 讲真话的人
- 理解紧迫性的决策者
- 有勇气坚持原则的公司和公民
- 以及足够的时间

时间不多了,但如果我们行动起来,我们仍然有机会通过这个考验——不是为了证明我们是最聪明的,而是为了证明我们是最有智慧的。


本文基于 Dario Amodei 的文章《The Adolescence of Technology》(2026 年 1 月)撰写。原文可在 https://www.darioamodei.com/essay/the-adolescence-of-technology 阅读。

目录 最新
← 左侧翻上一屏 · 右侧翻下一屏 · 中间唤出菜单