读懂 Anthropic：When AI builds itself

一句话版本

这篇文章的核心不是“AI 已经失控”，而是：AI 正在越来越多地接管 AI 研发里的执行工作，比如写代码、跑实验、修 bug、优化性能、分析下一步。只要这些环节越自动化，AI 公司研发下一代模型的速度就会被 AI 本身加速。

当这个循环闭合到“AI 能自主设计并开发自己的后继者”时，就叫递归自我改进。

注意两个层次的区别：今天的主张是“AI 正在加速 AI 研发”；更强、更不确定的主张是“AI 将能完整地自我改进”。文章想让读者重视前者，因为前者可能通向后者。

Anthropic 的论证可以拆成五步：

关键不在于哪一步听起来最科幻，而在于这个链条里的瓶颈是否持续从“人类执行”转向“人类判断”。

文章引用 METR 的趋势：模型能可靠完成的任务时长在快速增长，从几分钟级软件任务到小时级、十几小时级任务。

作者用它说明 AI 不只是回答更准，而是在变成能持续工作的代理。这个变化很重要，因为 AI 研发不是单次问答，而是一连串“计划、执行、观察、修正”的循环。

Anthropic 称，截至 2026 年 5 月，合并进生产代码库的代码中，超过 80% 可归因于 Claude；2026 年第二季度，典型工程师每天合并代码量约为 2024 年的 8 倍。

但这组数据要谨慎读。文章也承认“代码行数”会夸大真实生产力。一个团队多合并代码，不等于整个研发流程等比例变快；评审、可靠性、安全、组织协调都会变成新的限速器。

在一个固定目标的优化实验里，Claude 从 2025 年约 3 倍加速提升到 2026 年约 52 倍。重点不是绝对倍数，而是同一类任务上的能力提升很快。

还有一个关键证据：Anthropic 说 Claude 在“下一步该做什么”的研究判断上也在进步。但这部分证据更窄，文章自己也承认评测不是完整的人类与模型公平对照。

读这篇文章最重要的钥匙，是把 AI 研发拆成两类工作：

类型	例子	今天的状态
执行	写代码、跑实验、修 bug、优化性能、整理结果	AI 已经很强，而且提升很快
判断	决定什么问题值得做、哪些结果可信、什么时候放弃一条路线	正在进步，但证据还不充分

今天 AI 最强的是执行。文章最重要的不确定性是：研究品味和方向判断会不会也变成一种可训练、可扩展、可自动化的能力？

如果答案是“不太会”，那么 AI 仍然是极强助手，人类继续掌舵。如果答案是“会”，那么研发闭环就更可能闭合：AI 提问题、做实验、评估结果、改进模型，再用新模型继续下一轮。

能力提升遇到瓶颈，可能是架构、数据、算力、电力、供应链或研究判断本身。即使停在今天，AI 也会继续扩散并改变很多工作。

AI 自动化大部分执行，人类负责目标和验证。组织变得极高杠杆，但瓶颈会转移到评审、选择、协调和信任。

AI 能开发后继模型，进展速度主要受算力、训练效率和验证机制限制。人类角色转向监督、验证和治理。

第一，把“已观察到的事实”和“未来推断”分开。Anthropic 的内部数据很有信息量，但也来自一家有产品和政策立场的前沿 AI 公司。

第二，盯住瓶颈转移。AI 让写代码更快，不代表整个研发流程等比例变快；评审、可靠性、安全、组织决策都会变成新的限速器。

第三，别把递归自我改进想成科幻里的瞬间爆炸。文章更细腻的点是：即使实验室上游跑得像计算一样快，人类社会下游仍然受临床试验、法律、供应链、信任、制度等现实约束。

按文章的逻辑，什么能力最接近“AI 研发闭环真正闭合”的门槛？

答案是 3。

其他选项都很重要，但它们主要证明执行环节被自动化；闭环门槛在于方向判断是否也能被自动化。

我会把这篇文章读成一个“预警型论证”：它不是证明未来一定会出现 AI 自我递归爆炸，而是在说，即使还没到那一步，AI 已经在加速 AI 研发；如果“研究判断”也继续被自动化，社会、治理和安全准备可能会落后。

这也是文章最值得带走的一点：不要只问 AI 会不会突然自我进化，而要问 AI 正在把 AI 研发链条里的哪些环节变快，以及剩下的瓶颈到底在哪里。