Andrej Karpathy 加入 Anthropic 團隊專注於大型語言模型的預訓練研究

Andre Karpathy,這位人工智能研究員,曾共同創立並在 OpenAI 工作,並曾擔任 Tesla 的人工智能主管,最近已加入 Anthropic。Karpathy 在 X 平台上表示:「我已經加入了 Anthropic。我認為未來幾年在大型語言模型(LLMs)的前沿將會是特別具意義的。我非常期待加入這裡的團隊,重返研發領域。」

Karpathy 本週開始在 Anthropic 工作,專注於在團隊負責人 Nick Joseph 的指導下進行預訓練。根據公司資料,預訓練負責進行大規模訓練,以賦予 Claude 其核心知識和能力。同時,這也是建立前沿模型過程中最昂貴、計算密集的階段之一。Anthropic 的發言人告訴 TechCrunch,Karpathy 將組建一個專注於利用 Claude 來加速預訓練研究的團隊。

Karpathy 加入 Anthropic 將推動大型語言模型的發展

Karpathy 是少數能夠彌合大型語言模型理論與大規模訓練實踐之間差距的研究員之一。將他引入以建立這樣的團隊,顯示了 Anthropic 認為人工智能輔助研究,而非單純依賴計算能力,才是其在 OpenAI 和 Google 競爭中保持優勢的關鍵。在 OpenAI 工作期間,Karpathy 專注於深度學習和計算機視覺,直到 2017 年離職加入 Tesla。

他負責 Tesla 的全自動駕駛(FSD)和自動駕駛輔助系統項目,並於 2022 年離開。隨後,他回到 OpenAI 工作了一年,然後於 2024 年再次離開,創立了專注於將人工智能助手應用於教育的初創公司 Eureka Labs。

自 Eureka Labs 成立以來,Karpathy 尚未分享太多進展,目前尚不清楚這位著名研究員是否會繼續參與該初創公司。他還教授了一門名為《神經網絡:從零到英雄》的在線課程,幫助學生學習用代碼從頭構建神經網絡,並且他擁有一個 YouTube 頻道,定期發布有關 LLM 和人工智能的講座。Karpathy 表示:「我對教育仍然充滿熱情,並打算在適當的時候恢復我的相關工作。」

TechCrunch 已經聯繫 Karpathy 以獲取更多評論。

另外,Anthropic 也引進了 Chris Rohlft 加入其前沿紅隊,該團隊負責針對嚴重威脅進行先進人工智能模型的壓力測試。Rohlf 在網絡安全行業擁有超過 20 年的經驗,曾在 Yahoo 的知名網絡安全團隊「The Paranoids」工作,並且最近在 Meta 工作了六年,然後加入 Anthropic。他還曾是喬治城大學安全與新興技術中心的研究員,參與 CyberAI 項目的工作。

Rohlf 在 X 上發表的帖子中表示:「我們面前有一個真正的機會,可以利用人工智能大幅改善網絡安全。我想不出在這個關鍵時刻,還有哪家公司或團隊更適合加入。」

📬 免費訂閱 TechRitual 科技精選

按「免費訂閱」即同意收到 TechRitual 嘅科技資訊及優惠。可隨時取消訂閱。

Henderson
Henderson

Henderson 是 TechRitual Hong Kong 科技編輯,專注報導智能手機、消費電子產品、SIM 卡及流動通訊市場。自加入 TechRitual 以來,累計撰寫數千篇科技報導及產品評測,內容同步發佈至 SINA 及 Yahoo Tech 等主要平台。