Andrej Karpathy 宣佈加入 Anthropic 將專注於大模型研究團隊

Andrej Karpathy 宣佈加入 Anthropic。這位 OpenAI 創始團隊成員、前 Tesla AI 總監及 Eureka Labs 創辦人，剛剛宣佈重返前沿大模型研發一線。根據外媒報導，Karpathy 將加入 Anthropic 的 pre-training team，並參與組建一個利用 Claude 加速預訓練研究的團隊。Andrej Karpathy 這條消息公佈後，引發了 AI 圈的廣泛討論。

Karpathy 的履歷可謂極具辨識度，他同時擔任研究者、工程負責人、教育者及開發者社區的意見領袖等多重身份。他曾參與 OpenAI 的早期建設，亦在 Tesla 負責過大規模 AI 工程系統；離開大公司後，他透過課程、影片及 Eureka Labs 持續影響著大量開發者。

更重要的是，在正式加入 Anthropic 之前，他已是 Claude Code 最具影響力的外部使用者之一。今年 1 月，Karpathy 曾公開表示，自己的編程工作流發生了 20 年來最大的變化：過去主要依賴自己手寫代碼，現在大量工作由 Claude Code 這類 AI agent 驅動。這讓他的選擇多了一層意義。Karpathy 並非突然轉向 Anthropic，而是在深度使用 Claude 之後，選擇進入該公司，將自己的下一段時間投入模型研發現場。

Karpathy 重返模型研發一線的原因

在海外社交媒體上，Karpathy 表示未來幾年，前沿大模型的發展將至關重要，他希望回到研發現場。當然，過去兩年 Karpathy 並未離開 AI 領域。他創辦 Eureka Labs，持續進行 AI 教育，並輸出有關大模型、編程工具及開發者工作流的內容。以他的影響力，繼續從事教育和創業是一條自然的道路。然而，他最終選擇回到了模型公司，這表明在他看來，AI 最核心的問題仍發生在模型層面：數據如何組織，訓練如何穩定，推理能力如何不斷提升，代碼和 agent 能力可達到何種水平。

這些問題尚未到可以旁觀的階段。

Karpathy 的背景使他適合回到這個位置。他在 Tesla 參與過真實世界 AI 系統，瞭解模型進入工程現場後會遇到的複雜問題；他長期從事教育，亦知道一項技術如何被開發者理解、使用及誤用。研究、工程、教育三者的交叉，使他不僅是一位模型研究者，更像是一位能夠將模型能力與真實使用場景連接的人。

選擇 Anthropic 的原因與意義

如果僅從今天這條消息來看，會感到有些突兀。然而，若查看他今年的公開表達，則並不意外。今年 1 月，Karpathy 提到他的編程工作流發生了 20 年以來最大的變化，以前大部分代碼由他自己撰寫，現在大量工作則交由 Claude Code 這類 AI agent 完成。這意味著 Claude Code 已經進入了他的工作流。當前，許多人使用 AI 編程仍停留在補全、問答及生成代碼的階段，而 Karpathy 的使用方式已更接近日常協作，他會以項目的形式，提前設定目標和限制，再整理上下文，最後檢查 agent

執行後的結果。

開發者 Forrest Chang 隨後將 Karpathy 的 AI 編程原則整理成 CLAUDE.md，在 GitHub 上快速傳播。該項目走紅，反映出開發者工作方式正在變化。過去項目中有 README，供人查看；有 CONTRIBUTING，供團隊參考；有 lint 和 test，供代碼質量系統檢查。如今多了 CLAUDE.md，開發者開始為 AI agent 撰寫工作説明，告訴它項目習慣、邊界及處理不確定問題的方式。

這也是 Anthropic 當前的一大優勢。Claude 不僅在模型榜單上競爭，還通過 Claude Code 融入部分開發者的日常工作流。

在 Karpathy 加入之前，他已經用自己的工作方式為 Claude 做過一次高質量的背書。加入之後，他將瞭解 Claude 的優勢與不足之處，為開發者提供信心的同時，也指出需要改進的地方。

Karpathy 也不是第一位從 OpenAI 轉向 Anthropic 的重要人物。Jan Leike 和 John Schulman 也已加入 Anthropic，現在又迎來了 Karpathy。這幾位人物的背景各不相同，但在 AI 圈中均具重磅地位。Anthropic 給外界的印象更加專注，專注於提供更優秀的模型能力。安全性、對齊性及可解釋性一直是其主線，Claude 在寫作、代碼、長上下文及開發者體驗上的口碑在過去一年快速提升。

隨著 Claude Code 的推出，Anthropic 與開發者之間的連結變得更加具體。對於研究者來説，Anthropic 是一個聚焦明確、產品逐漸增強且問題足夠大的組織，這本身就極具吸引力。尤其對於 Karpathy 這類既懂模型又理解工程的人來説，Anthropic 提供的並不僅僅是一個研究崗位，也是一條將模型能力推進至實際研發流程的道路。

當然，單個頂尖研究者的加入不會立即改變模型排名。AI 公司的競爭仍然取決於算力、數據、訓練系統、產品分發、收入及組織執行。不過，人才流動始終是一個重要信號。選擇多的人，其下一步往往能反映他對行業重心的判斷。

根據外媒的報導，Karpathy 將加入 Anthropic 的 pre-training team，並協助組建一個利用 Claude 加速預訓練研究的團隊。預訓練是模型公司的核心領域。外界通常看到的是模型發布、榜單成績、API 及產品演示，但模型能力的增長在很大程度上取決於預訓練階段的工作：數據配比、訓練穩定性、架構調整、評估設計、失敗結果分析，每一項都至關重要。

預訓練是模型公司的深水區。外界通常看到的是模型發布、榜單、API、產品演示，但模型能力的增長在很大程度上取決於預訓練階段的工作。數據如何配比、訓練如何穩定、架構如何調整、評估如何進行、失敗結果如何解釋，這些均屬於艱巨的任務。Karpathy 的目標是將 Claude 融入這一研發流程中。

例如，研究員提出一個訓練假設時，Claude 可以協助撰寫實驗代碼、修改配置、補充評估腳本及整理日誌。當實驗結果不理想時，Claude 還能幫助歸類失敗樣本，找出潛在問題。在下一輪實驗開始前，Claude 也能將前幾輪的記錄整理成更易於閲讀和回顧的材料。這些都是研發中的日常工作，但它們決定了研究循環的速度。AI 研發所耗費的時間，往往不僅在靈感本身，而在靈感轉化為實驗、實驗轉化為結果、結果轉化為下一輪判斷的過程中。

每個環節的效率提高，將使長期差距擴大。

Karpathy 的價值正體現在此。他了解模型訓練，掌握工程系統，並且是 AI 編程工具的重度用户。他知道哪些任務適合交由 agent 處理，哪些地方必須保留人工審查，哪些自動化看似方便卻可能潛藏風險。對於 Anthropic 來説，這樣的人選非常適合將 Claude 從開發者工具進一步引入研究系統。

這一變化對普通開發者也有參考意義。AI 編程不會長期停留在「幫助減少幾行代碼」的階段。工程師的工作將越來越像管理一個小型協作系統：拆分任務、撰寫邊界、檢查結果，將 agent 產出的內容接入實際項目。代碼能力依然重要，但組織 AI 工作的能力將變得愈加關鍵。

Karpathy 加入 Anthropic，當然無法説明 Anthropic 已經贏得競爭，也無法保證 Claude 將來會壓倒所有模型。AI 公司之間的競爭最終仍將聚焦於模型能力、產品體驗、算力、分發及組織執行。然而，值得關注的是，Karpathy 不是在旁觀評價 Claude，而是將自己的下一段時間投入其中。這位長期從事代碼撰寫、研究及工程團隊管理，並懂得教育的人，選擇前往 Anthropic 從事預訓練研究，並將 Claude 用於模型研發流程，本身就是一個有分量的舉動。

對於開發者而言，這則新聞並非遙遠的行業八卦。Claude Code、CLAUDE.md、agentic coding 等元素，已在改變部分人的工作方式。今日它們首先出現在 Karpathy 這類重度用户身上，明日則可能成為更多工程團隊的基本配置。因此，最值得關注的，並非僅是 Karpathy 前往了哪家公司，而是他將自己的判斷押在了何處：前沿模型將繼續前進，AI agent 將進入愈加核心的研發流程，而 Anthropic，至少在當前，正在成為這條路上日益重要的參與者。

想睇更深入嘅 AI 模型與工程科技報道？

前往 The Base Principle 繁體中文 AI 新聞 →

Andrej Karpathy 宣佈加入 Anthropic 將專注於大模型研究團隊

Karpathy 重返模型研發一線的原因

選擇 Anthropic 的原因與意義

Henderson

搜尋文章