来源: When AI builds itself - Anthropic Institute
一句话版本
这篇文章的核心不是“AI 已经失控”,而是:AI 正在越来越多地接管 AI 研发里的执行工作,比如写代码、跑实验、修 bug、优化性能、分析下一步。只要这些环节越自动化,AI 公司研发下一代模型的速度就会被 AI 本身加速。
当这个循环闭合到“AI 能自主设计并开发自己的后继者”时,就叫递归自我改进。
注意两个层次的区别:今天的主张是“AI 正在加速 AI 研发”;更强、更不确定的主张是“AI 将能完整地自我改进”。文章想让读者重视前者,因为前者可能通向后者。
文章的论证链
Anthropic 的论证可以拆成五步:
- 人类全手动:早期 Claude 研发主要是人写代码、写文档、跑实验。
- 聊天助手:AI 先帮忙生成片段,工程师复制、修改、集成。
- 编码代理:AI 开始直接改文件、运行代码、处理较完整任务。
- 自主代理:AI 能把数小时任务拆开做,甚至委派给其他代理。
- 研发闭环:未来如果 AI 能训练、评估、改进模型,Claude 可能参与制造下一代 Claude。
关键不在于哪一步听起来最科幻,而在于这个链条里的瓶颈是否持续从“人类执行”转向“人类判断”。
Anthropic 给了哪些证据?
1. 外部基准:任务时长变长
文章引用 METR 的趋势:模型能可靠完成的任务时长在快速增长,从几分钟级软件任务到小时级、十几小时级任务。
作者用它说明 AI 不只是回答更准,而是在变成能持续工作的代理。这个变化很重要,因为 AI 研发不是单次问答,而是一连串“计划、执行、观察、修正”的循环。
2. 内部工程:Claude 写了大量代码
Anthropic 称,截至 2026 年 5 月,合并进生产代码库的代码中,超过 80% 可归因于 Claude;2026 年第二季度,典型工程师每天合并代码量约为 2024 年的 8 倍。
但这组数据要谨慎读。文章也承认“代码行数”会夸大真实生产力。一个团队多合并代码,不等于整个研发流程等比例变快;评审、可靠性、安全、组织协调都会变成新的限速器。
3. 内部研究:实验执行越来越强
在一个固定目标的优化实验里,Claude 从 2025 年约 3 倍加速提升到 2026 年约 52 倍。重点不是绝对倍数,而是同一类任务上的能力提升很快。
还有一个关键证据:Anthropic 说 Claude 在“下一步该做什么”的研究判断上也在进步。但这部分证据更窄,文章自己也承认评测不是完整的人类与模型公平对照。
真正的分水岭:执行 vs 判断
读这篇文章最重要的钥匙,是把 AI 研发拆成两类工作:
| 类型 | 例子 | 今天的状态 |
|---|---|---|
| 执行 | 写代码、跑实验、修 bug、优化性能、整理结果 | AI 已经很强,而且提升很快 |
| 判断 | 决定什么问题值得做、哪些结果可信、什么时候放弃一条路线 | 正在进步,但证据还不充分 |
今天 AI 最强的是执行。文章最重要的不确定性是:研究品味和方向判断会不会也变成一种可训练、可扩展、可自动化的能力?
如果答案是“不太会”,那么 AI 仍然是极强助手,人类继续掌舵。如果答案是“会”,那么研发闭环就更可能闭合:AI 提问题、做实验、评估结果、改进模型,再用新模型继续下一轮。
三种未来
1. 趋势停滞:S 曲线
能力提升遇到瓶颈,可能是架构、数据、算力、电力、供应链或研究判断本身。即使停在今天,AI 也会继续扩散并改变很多工作。
2. 复合效率:人类定方向
AI 自动化大部分执行,人类负责目标和验证。组织变得极高杠杆,但瓶颈会转移到评审、选择、协调和信任。
3. 完整闭环:递归自我改进
AI 能开发后继模型,进展速度主要受算力、训练效率和验证机制限制。人类角色转向监督、验证和治理。
怎么读这篇文章才不被带跑?
第一,把“已观察到的事实”和“未来推断”分开。Anthropic 的内部数据很有信息量,但也来自一家有产品和政策立场的前沿 AI 公司。
第二,盯住瓶颈转移。AI 让写代码更快,不代表整个研发流程等比例变快;评审、可靠性、安全、组织决策都会变成新的限速器。
第三,别把递归自我改进想成科幻里的瞬间爆炸。文章更细腻的点是:即使实验室上游跑得像计算一样快,人类社会下游仍然受临床试验、法律、供应链、信任、制度等现实约束。
自测题
按文章的逻辑,什么能力最接近“AI 研发闭环真正闭合”的门槛?
- AI 能写出比人类更多的代码。
- AI 能在固定指标下把实验代码优化得很快。
- AI 能自己选择值得研究的问题,并判断结果是否可信。
- AI 能让每家公司的人均代码量上升。
答案是 3。
其他选项都很重要,但它们主要证明执行环节被自动化;闭环门槛在于方向判断是否也能被自动化。
我的读法
我会把这篇文章读成一个“预警型论证”:它不是证明未来一定会出现 AI 自我递归爆炸,而是在说,即使还没到那一步,AI 已经在加速 AI 研发;如果“研究判断”也继续被自动化,社会、治理和安全准备可能会落后。
这也是文章最值得带走的一点:不要只问 AI 会不会突然自我进化,而要问 AI 正在把 AI 研发链条里的哪些环节变快,以及剩下的瓶颈到底在哪里。