返回技术博客

Karpathy 加入 Anthropic:为什么顶级研究者选择了 Claude

5 月 19 号,Karpathy 发了条推:「I've joined Anthropic. I think the next few years at the frontier of LLMs will be especially formative. I am very excited to join the team here and get back to R&D.」

这条消息在 Hacker News 上拿了 1400 多分。不是因为一个人换工作本身有多大新闻价值,而是因为这个人的每一次选择都像一个行业风向标。

Karpathy 是谁

简单过一下他的履历:

  • 斯坦福 CS PhD,博士导师是 Fei-Fei Li(ImageNet 那位)
  • OpenAI 联合创始人之一,早期核心研究员
  • 2017 年加入 Tesla,领导 Autopilot 和 FSD(全自动驾驶)团队
  • 2022 年离开 Tesla,回到 OpenAI 待了一年
  • 2024 年离开 OpenAI,创办 Eureka Labs(AI 教育)
  • 2026 年 5 月加入 Anthropic

在 AI 圈,Karpathy 的独特之处不在于他发了多少论文(虽然也不少),而在于他是极少数能同时做顶级研究和大规模工程落地的人。Autopilot 团队在他手下从原型做到了量产。这种经验在学术界几乎找不到。

另外他的 YouTube 教程(Neural Networks: Zero to Hero)让无数人入门了深度学习。他在 X 上发的技术观点经常引发整个行业的讨论。

他在 Anthropic 做什么

TechCrunch 报道说,Karpathy 加入的是 Nick Joseph 领导的预训练团队,负责建一个新的子团队:用 Claude 来加速预训练研究。

这句话需要拆开理解。

预训练(pre-training)是 LLM 开发中最烧钱、最耗算力的阶段。简单说就是拿海量文本训练出模型的基础能力。GPT-4、Claude 3.5 这些模型的核心智力水平,基本是在预训练阶段决定的。后续的 RLHF、微调都是在这个基础上做调整。

「用 Claude 来加速预训练研究」意味着什么?意味着 Anthropic 在赌一个方向:AI 辅助的 AI 研究(AI-assisted AI research)。不是简单地堆更多 GPU,而是让 AI 自己帮忙想出更好的训练方法。

这和 Karpathy 自己做的 autoresearch 项目完全一脉相承。

为什么不回 OpenAI

这是所有人都在问的问题。他是 OpenAI 的联合创始人,和 Sam Altman 共事过,按道理回老东家最顺理成章。

他没有公开解释原因,但可以从几个角度推测:

研究自由度。 OpenAI 现在的重心是产品和商业化(ChatGPT、API、企业客户)。Anthropic 相对来说更偏研究导向,尤其是在 AI 安全和模型能力的基础研究方面投入更大。

技术路线。 Karpathy 的推文里说「the next few years at the frontier of LLMs will be especially formative」。这暗示他相信预训练层面还有重大突破的空间,而不是像有些人说的「scaling is dead」。Anthropic 的 Claude 系列在最近一年的进步速度很快,可能在预训练方法上有一些 OpenAI 没有的路线。

团队规模。 在一个 3000 人的公司里建新团队,和在一个 1000 人的公司里建新团队,组织阻力完全不同。Anthropic 更小、更灵活。

当然这些都是猜测。但有一点是确定的:当一个同时了解 OpenAI 内部和整个行业格局的人选择了 Anthropic,这本身就说明了一些事情。

对行业意味着什么

过去两年,AI 行业的人才流动有一个明显的趋势:顶级研究者从大公司流向更小、更聚焦的团队。

Ilya Sutskever 离开 OpenAI 创办了 SSI。Karpathy 现在选择了 Anthropic。Dario Amodei 自己就是从 OpenAI 出来创办 Anthropic 的。

这些选择背后有一个共同的判断:AI 研究的下一个突破不会来自简单地把现有方法放大(更多 GPU、更多数据),而是需要方法论层面的创新。而方法论创新更适合在小团队、高密度人才、研究导向的环境里发生。

Karpathy 加入 Anthropic 做「用 AI 加速 AI 研究」,可能是目前为止这个趋势最清晰的信号。

他会继续做教育吗

在公告推文里他加了一句:「I remain deeply passionate about education and plan to resume my work on it in time.」

Eureka Labs 的状态不明。自从去年发布后就没有太多更新。加入 Anthropic 是全职,所以教育这边大概率暂时搁置了。但考虑到他在教育上的影响力(Zero to Hero 系列改变了很多人的职业轨迹),这个领域迟早会回来。

也许以后他会用 Anthropic 的技术做教育产品。这就是后话了。


这是 AI Agent 系列的第八篇。前几篇: