Andrej Karpathy 宣佈加入 Anthropic。這位 OpenAI 創始團隊成員、前 Tesla AI 總監及 Eureka Labs 創辦人,剛剛宣佈重返前沿大模型研發一線。根據外媒報導,Karpathy 將加入 Anthropic 的 pre-training team,並參與組建一個利用 Claude 加速預訓練研究的團隊。Andrej Karpathy 這條消息公佈後,引發了 AI 圈的廣泛討論。
Karpathy 的履歷可謂極具辨識度,他同時擔任研究者、工程負責人、教育者及開發者社區的意見領袖等多重身份。他曾參與 OpenAI 的早期建設,亦在 Tesla 負責過大規模 AI 工程系統;離開大公司後,他透過課程、影片及 Eureka Labs 持續影響著大量開發者。
更重要的是,在正式加入 Anthropic 之前,他已是 Claude Code 最具影響力的外部使用者之一。今年 1 月,Karpathy 曾公開表示,自己的編程工作流發生了 20 年來最大的變化:過去主要依賴自己手寫代碼,現在大量工作由 Claude Code 這類 AI agent 驅動。這讓他的選擇多了一層意義。Karpathy 並非突然轉向 Anthropic,而是在深度使用 Claude 之後,選擇進入該公司,將自己的下一段時間投入模型研發現場。
Karpathy 重返模型研發一線的原因
在海外社交媒體上,Karpathy 表示未來幾年,前沿大模型的發展將至關重要,他希望回到研發現場。當然,過去兩年 Karpathy 並未離開 AI 領域。他創辦 Eureka Labs,持續進行 AI 教育,並輸出有關大模型、編程工具及開發者工作流的內容。以他的影響力,繼續從事教育和創業是一條自然的道路。然而,他最終選擇回到了模型公司,這表明在他看來,AI 最核心的問題仍發生在模型層面:數據如何組織,訓練如何穩定,推理能力如何不斷提升,代碼和 agent 能力可達到何種水平。
這些問題尚未到可以旁觀的階段。
Karpathy 的背景使他適合回到這個位置。他在 Tesla 參與過真實世界 AI 系統,瞭解模型進入工程現場後會遇到的複雜問題;他長期從事教育,亦知道一項技術如何被開發者理解、使用及誤用。研究、工程、教育三者的交叉,使他不僅是一位模型研究者,更像是一位能夠將模型能力與真實使用場景連接的人。
選擇 Anthropic 的原因與意義
如果僅從今天這條消息來看,會感到有些突兀。然而,若查看他今年的公開表達,則並不意外。今年 1 月,Karpathy 提到他的編程工作流發生了 20 年以來最大的變化,以前大部分代碼由他自己撰寫,現在大量工作則交由 Claude Code 這類 AI agent 完成。這意味著 Claude Code 已經進入了他的工作流。當前,許多人使用 AI 編程仍停留在補全、問答及生成代碼的階段,而 Karpathy 的使用方式已更接近日常協作,他會以項目的形式,提前設定目標和限制,再整理上下文,最後檢查 agent
執行後的結果。
開發者 Forrest Chang 隨後將 Karpathy 的 AI 編程原則整理成 CLAUDE.md,在 GitHub 上快速傳播。該項目走紅,反映出開發者工作方式正在變化。過去項目中有 README,供人查看;有 CONTRIBUTING,供團隊參考;有 lint 和 test,供代碼質量系統檢查。如今多了 CLAUDE.md,開發者開始為 AI agent 撰寫工作説明,告訴它項目習慣、邊界及處理不確定問題的方式。
這也是 Anthropic 當前的一大優勢。Claude 不僅在模型榜單上競爭,還通過 Claude Code 融入部分開發者的日常工作流。
在 Karpathy 加入之前,他已經用自己的工作方式為 Claude 做過一次高質量的背書。加入之後,他將瞭解 Claude 的優勢與不足之處,為開發者提供信心的同時,也指出需要改進的地方。
Karpathy 也不是第一位從 OpenAI 轉向 Anthropic 的重要人物。Jan Leike 和 John Schulman 也已加入 Anthropic,現在又迎來了 Karpathy。這幾位人物的背景各不相同,但在 AI 圈中均具重磅地位。Anthropic 給外界的印象更加專注,專注於提供更優秀的模型能力。安全性、對齊性及可解釋性一直是其主線,Claude 在寫作、代碼、長上下文及開發者體驗上的口碑在過去一年快速提升。
隨著 Claude Code 的推出,Anthropic 與開發者之間的連結變得更加具體。對於研究者來説,Anthropic 是一個聚焦明確、產品逐漸增強且問題足夠大的組織,這本身就極具吸引力。尤其對於 Karpathy 這類既懂模型又理解工程的人來説,Anthropic 提供的並不僅僅是一個研究崗位,也是一條將模型能力推進至實際研發流程的道路。
當然,單個頂尖研究者的加入不會立即改變模型排名。AI 公司的競爭仍然取決於算力、數據、訓練系統、產品分發、收入及組織執行。不過,人才流動始終是一個重要信號。選擇多的人,其下一步往往能反映他對行業重心的判斷。
根據外媒的報導,Karpathy 將加入 Anthropic 的 pre-training team,並協助組建一個利用 Claude 加速預訓練研究的團隊。預訓練是模型公司的核心領域。外界通常看到的是模型發布、榜單成績、API 及產品演示,但模型能力的增長在很大程度上取決於預訓練階段的工作:數據配比、訓練穩定性、架構調整、評估設計、失敗結果分析,每一項都至關重要。
預訓練是模型公司的深水區。外界通常看到的是模型發布、榜單、API、產品演示,但模型能力的增長在很大程度上取決於預訓練階段的工作。數據如何配比、訓練如何穩定、架構如何調整、評估如何進行、失敗結果如何解釋,這些均屬於艱巨的任務。Karpathy 的目標是將 Claude 融入這一研發流程中。
例如,研究員提出一個訓練假設時,Claude 可以協助撰寫實驗代碼、修改配置、補充評估腳本及整理日誌。當實驗結果不理想時,Claude 還能幫助歸類失敗樣本,找出潛在問題。在下一輪實驗開始前,Claude 也能將前幾輪的記錄整理成更易於閲讀和回顧的材料。這些都是研發中的日常工作,但它們決定了研究循環的速度。AI 研發所耗費的時間,往往不僅在靈感本身,而在靈感轉化為實驗、實驗轉化為結果、結果轉化為下一輪判斷的過程中。
每個環節的效率提高,將使長期差距擴大。
Karpathy 的價值正體現在此。他了解模型訓練,掌握工程系統,並且是 AI 編程工具的重度用户。他知道哪些任務適合交由 agent 處理,哪些地方必須保留人工審查,哪些自動化看似方便卻可能潛藏風險。對於 Anthropic 來説,這樣的人選非常適合將 Claude 從開發者工具進一步引入研究系統。
這一變化對普通開發者也有參考意義。AI 編程不會長期停留在「幫助減少幾行代碼」的階段。工程師的工作將越來越像管理一個小型協作系統:拆分任務、撰寫邊界、檢查結果,將 agent 產出的內容接入實際項目。代碼能力依然重要,但組織 AI 工作的能力將變得愈加關鍵。
Karpathy 加入 Anthropic,當然無法説明 Anthropic 已經贏得競爭,也無法保證 Claude 將來會壓倒所有模型。AI 公司之間的競爭最終仍將聚焦於模型能力、產品體驗、算力、分發及組織執行。然而,值得關注的是,Karpathy 不是在旁觀評價 Claude,而是將自己的下一段時間投入其中。這位長期從事代碼撰寫、研究及工程團隊管理,並懂得教育的人,選擇前往 Anthropic 從事預訓練研究,並將 Claude 用於模型研發流程,本身就是一個有分量的舉動。
對於開發者而言,這則新聞並非遙遠的行業八卦。Claude Code、CLAUDE.md、agentic coding 等元素,已在改變部分人的工作方式。今日它們首先出現在 Karpathy 這類重度用户身上,明日則可能成為更多工程團隊的基本配置。因此,最值得關注的,並非僅是 Karpathy 前往了哪家公司,而是他將自己的判斷押在了何處:前沿模型將繼續前進,AI agent 將進入愈加核心的研發流程,而 Anthropic,至少在當前,正在成為這條路上日益重要的參與者。
📬 免費訂閱 TechRitual 科技精選
按「免費訂閱」即同意收到 TechRitual 嘅科技資訊及優惠。可隨時取消訂閱。

