| 来源: Anthropic Institute

读懂 Anthropic:When AI builds itself

Anthropic Institute 关于递归自我改进的文章拆解:AI 正在加速 AI 研发,但完整闭环的关键在于研究判断是否也能自动化。

来源: When AI builds itself - Anthropic Institute


一句话版本

这篇文章的核心不是“AI 已经失控”,而是:AI 正在越来越多地接管 AI 研发里的执行工作,比如写代码、跑实验、修 bug、优化性能、分析下一步。只要这些环节越自动化,AI 公司研发下一代模型的速度就会被 AI 本身加速。

当这个循环闭合到“AI 能自主设计并开发自己的后继者”时,就叫递归自我改进

注意两个层次的区别:今天的主张是“AI 正在加速 AI 研发”;更强、更不确定的主张是“AI 将能完整地自我改进”。文章想让读者重视前者,因为前者可能通向后者。

文章的论证链

Anthropic 的论证可以拆成五步:

  1. 人类全手动:早期 Claude 研发主要是人写代码、写文档、跑实验。
  2. 聊天助手:AI 先帮忙生成片段,工程师复制、修改、集成。
  3. 编码代理:AI 开始直接改文件、运行代码、处理较完整任务。
  4. 自主代理:AI 能把数小时任务拆开做,甚至委派给其他代理。
  5. 研发闭环:未来如果 AI 能训练、评估、改进模型,Claude 可能参与制造下一代 Claude。

关键不在于哪一步听起来最科幻,而在于这个链条里的瓶颈是否持续从“人类执行”转向“人类判断”。

Anthropic 给了哪些证据?

1. 外部基准:任务时长变长

文章引用 METR 的趋势:模型能可靠完成的任务时长在快速增长,从几分钟级软件任务到小时级、十几小时级任务。

作者用它说明 AI 不只是回答更准,而是在变成能持续工作的代理。这个变化很重要,因为 AI 研发不是单次问答,而是一连串“计划、执行、观察、修正”的循环。

2. 内部工程:Claude 写了大量代码

Anthropic 称,截至 2026 年 5 月,合并进生产代码库的代码中,超过 80% 可归因于 Claude;2026 年第二季度,典型工程师每天合并代码量约为 2024 年的 8 倍。

但这组数据要谨慎读。文章也承认“代码行数”会夸大真实生产力。一个团队多合并代码,不等于整个研发流程等比例变快;评审、可靠性、安全、组织协调都会变成新的限速器。

3. 内部研究:实验执行越来越强

在一个固定目标的优化实验里,Claude 从 2025 年约 3 倍加速提升到 2026 年约 52 倍。重点不是绝对倍数,而是同一类任务上的能力提升很快。

还有一个关键证据:Anthropic 说 Claude 在“下一步该做什么”的研究判断上也在进步。但这部分证据更窄,文章自己也承认评测不是完整的人类与模型公平对照。

真正的分水岭:执行 vs 判断

读这篇文章最重要的钥匙,是把 AI 研发拆成两类工作:

类型例子今天的状态
执行写代码、跑实验、修 bug、优化性能、整理结果AI 已经很强,而且提升很快
判断决定什么问题值得做、哪些结果可信、什么时候放弃一条路线正在进步,但证据还不充分

今天 AI 最强的是执行。文章最重要的不确定性是:研究品味和方向判断会不会也变成一种可训练、可扩展、可自动化的能力?

如果答案是“不太会”,那么 AI 仍然是极强助手,人类继续掌舵。如果答案是“会”,那么研发闭环就更可能闭合:AI 提问题、做实验、评估结果、改进模型,再用新模型继续下一轮。

三种未来

1. 趋势停滞:S 曲线

能力提升遇到瓶颈,可能是架构、数据、算力、电力、供应链或研究判断本身。即使停在今天,AI 也会继续扩散并改变很多工作。

2. 复合效率:人类定方向

AI 自动化大部分执行,人类负责目标和验证。组织变得极高杠杆,但瓶颈会转移到评审、选择、协调和信任。

3. 完整闭环:递归自我改进

AI 能开发后继模型,进展速度主要受算力、训练效率和验证机制限制。人类角色转向监督、验证和治理。

怎么读这篇文章才不被带跑?

第一,把“已观察到的事实”和“未来推断”分开。Anthropic 的内部数据很有信息量,但也来自一家有产品和政策立场的前沿 AI 公司。

第二,盯住瓶颈转移。AI 让写代码更快,不代表整个研发流程等比例变快;评审、可靠性、安全、组织决策都会变成新的限速器。

第三,别把递归自我改进想成科幻里的瞬间爆炸。文章更细腻的点是:即使实验室上游跑得像计算一样快,人类社会下游仍然受临床试验、法律、供应链、信任、制度等现实约束。

自测题

按文章的逻辑,什么能力最接近“AI 研发闭环真正闭合”的门槛?

  1. AI 能写出比人类更多的代码。
  2. AI 能在固定指标下把实验代码优化得很快。
  3. AI 能自己选择值得研究的问题,并判断结果是否可信。
  4. AI 能让每家公司的人均代码量上升。

答案是 3。

其他选项都很重要,但它们主要证明执行环节被自动化;闭环门槛在于方向判断是否也能被自动化。

我的读法

我会把这篇文章读成一个“预警型论证”:它不是证明未来一定会出现 AI 自我递归爆炸,而是在说,即使还没到那一步,AI 已经在加速 AI 研发;如果“研究判断”也继续被自动化,社会、治理和安全准备可能会落后。

这也是文章最值得带走的一点:不要只问 AI 会不会突然自我进化,而要问 AI 正在把 AI 研发链条里的哪些环节变快,以及剩下的瓶颈到底在哪里。

查看原文