| 来源: Andrej Karpathy

Karpathy 的 Claude Code 编程随记

二十年编程生涯最大的工作流转变,发生在短短几周内。从80%手动编程到80%智能体编程——Karpathy 分享了真实的开发体验、模型局限、以及对行业未来的思考。

Karpathy 是前特斯拉 AI 负责人、OpenAI 创始成员。这篇推文记录了他过去几周密集使用 Claude Code 编程的真实体验——不是 hype,而是一线开发者的观察和反思。

核心判断:LLM 智能体的能力在 2025 年 12 月前后跨越了某种连贯性阈值,引发了软件工程的相变。


编程工作流:二十年最大的转变

鉴于 LLM 编程能力的最新提升,和许多人一样,我在短短一个月内经历了巨大转变:

也就是说,我现在真的主要是用英语在编程了,有点不好意思地用语言告诉 LLM 该写什么代码……就是用文字描述。

这多少有点伤自尊,但用大规模"代码动作"来操控软件的能力实在太有用了,尤其是当你适应它、配置它、学会使用它、并理解它能做什么不能做什么之后。

这是我近二十年编程生涯中对基本工作流最大的一次改变,而且发生在短短几周内。

我估计有两位数百分比的工程师正在经历类似的转变,而普通大众对此的感知程度可能还在低个位数百分比。


IDE 和智能体集群:炒作过度

在我看来,"不再需要 IDE"和"智能体集群"的炒作都过于超前了。

模型肯定还会犯错,如果你有任何真正在意的代码,我建议你像盯着鹰一样盯着它们,同时在旁边开一个大 IDE。

错误的性质变了

不再是简单的语法错误,而是那种有点马虎、急躁的初级开发者可能会犯的微妙概念性错误:

在计划模式下情况会好一些,但确实需要一个轻量级的内联计划模式。

尽管在 CLAUDE.md 中做了一些简单的指令尝试,这些问题依然存在。尽管有这些问题,它仍然是一个巨大的净改进,很难想象再回到手动编程。

我的当前工作流

每个人都有自己正在发展的工作流,我目前的做法是:


韧性:感受 AGI 的时刻

看着智能体不知疲倦地钻研某个问题真的很有意思。

它们永远不会累,永远不会气馁,就是一直尝试各种方法,而人类早就放弃了等改天再战。

看着它在某件事上挣扎很长时间,然后 30 分钟后终于成功,这是一个"感受 AGI"的时刻。

你意识到耐力是工作的一个核心瓶颈,而有了 LLM,这个瓶颈被大大提升了。


加速还是扩展?

如何衡量 LLM 辅助带来的"加速"并不清楚。

当然,在我原本要做的事情上,我感觉明显快了很多,但主要效果是我做的事情比原计划多得多:

  1. 我可以写各种以前根本不值得写的代码
  2. 我可以接触以前因为知识/技能不足而无法触碰的代码

所以这当然是加速,但更可能是一种扩展


杠杆:从命令式到声明式

LLM 特别擅长循环执行直到达成特定目标,这也是"感受 AGI"魔力的主要来源。

不要告诉它做什么,给它成功标准,然后看着它行动。

把你的方法从命令式转变为声明式,让智能体循环更久,获得更大杠杆。


编程变得更有趣了

我没有预料到的是,有了智能体,编程感觉更有趣了。

因为很多填空式的繁琐工作被移除了,剩下的是创造性的部分。我也更少感到受阻/卡住(这很不爽),而且我体验到更多勇气,因为几乎总有办法与它携手合作取得一些积极进展。

我也看到了其他人表达相反的情绪。LLM 编程会把工程师分成两类:


能力退化的隐忧

我已经注意到,我手动编写代码的能力正在慢慢退化。

生成(写代码)和判别(读代码)是大脑中不同的能力。主要由于编程中涉及的许多小的、大多是语法层面的细节,即使你难以写代码,你仍然可以很好地审查代码。


2026:垃圾末日之年

我正在为 2026 年做好准备,这将是整个 GitHub、Substack、arXiv、X/Instagram 以及所有数字媒体的垃圾末日之年。

我们还会看到更多 AI 炒作的生产力表演(这还可能吗?),以及真正实际的改进。


几个开放问题


结论:相变已经发生

LLM 智能体能力(尤其是 Claude 和 Codex)在 2025 年 12 月前后跨越了某种连贯性阈值,引发了软件工程及相关领域的相变。

智能部分突然感觉大大领先于其他一切——集成(工具、知识)、新组织工作流的必要性、流程、更广泛的扩散。

2026 年将是高能量的一年,整个行业将消化吸收这些新能力。


一句话总结:用大规模"代码动作"操控软件的能力实在太有用了——这是二十年编程生涯最大的工作流转变,发生在短短几周内。

查看原文