前 DeepSeek 研究員羅福莉正式加入小米,專注於 AGI 研發

前DeepSeek研究員羅福莉已正式加入小米。她於社交媒體上發文表示:“智能終將從語言邁向物理世界。我正在 Xiaomi MiMo,與一群富有創造力、才華橫溢且真誠熱愛的研究員,致力於構建這樣的未來,全力奔赴我們心目中的 AGI。”

Xiaomi MiMo 是小米首個推理大模型。這也是羅福莉正式宣布自己已加入小米,並對此前的傳言作出回應。此前有消息稱,小米創始人雷軍以千萬年薪招攬了 DeepSeek 開源大模型 DeepSeek-V2 的關鍵開發者之一羅福莉,負責領導小米 AI 大模型團隊。

報導指出,小米公司正積極搭建自己的 GPU 萬卡集群,以加大對 AI 大模型的投入力度。在成立之初,小米大模型團隊就已擁有 6,500 張 GPU 資源,而此次搭建 GPU 萬卡集群將進一步提升小米在 AI 大模型領域的研發實力。據知情人士透露,該計劃已實施數月,雷軍在其中扮演了重要的領導角色,他對 AI 硬體的重視程度極高,認為手機是 AI 硬體領域的核心,小米必須全力以赴。

不過,小米當時並未對此事作出回應,羅福莉本人也未直接回應。據媒體報導,羅福莉曾在社交媒體上表示,“請互聯網還我一片安安靜靜做事的氛圍吧,我不是天才少女,只想安安靜靜做難而正確的事情。”另外,2 月 18 日有媒體報導她已到新崗位上班,但在小米內部員工系統中,當時並未顯示“羅福莉”的相關信息。

值得注意的是,今年 10 月,小米 AI 團隊與北京大學聯合發佈了一篇聚焦 MoE 與強化學習的論文,其中已出現羅福莉的名字,這或許標誌著她將以小米的新身份正式對外露面。

公開資料顯示,羅福莉本科畢業於北京師範大學計算機專業,碩士階段進入北京大學計算語言學深造。碩士畢業後,羅福莉加入阿里巴巴達摩院,擔任機器智能實驗室研究員,負責開發多語言預訓練模型 VECO,並推動 AliceMind 項目的開源工作。2022 年,羅福莉加入 DeepSeek 母公司幻方量化,從事深度學習相關工作,後又擔任 DeepSeek 的深度學習研究員,參與研發 DeepSeek-V2 等模型。


Henderson
Henderson 主要擔任「炒稿記者」的職責,以翻譯最新科技,手機 電動車等消息為每天的工作。