2026 年 4 月末,DeepSeek 發佈長達 58 頁的 V4 技術報告。在近 300 人的作者名單中,10 位核心研究者被標註「已離職」——這個細節像一道裂縫,悄然撕裂了這家「技術理想主義」標杆的完美表象。兩個月後,一則消息震驚中國 AI 圈:國家集成電路產業投資基金(大基金)正洽談領投 DeepSeek 首輪融資,估值從最初的 100 億美元飆升至 450 億美元,甚至有望衝擊 500 億美元。
這家曾以「零外部融資」為信條的明星公司,終於向資本打開了大門。
從「不接受外部融資」到「450 億估值」,DeepSeek 的戰略轉向並非金錢飢渴的投機,而更像一場關乎生存的防禦戰。三條邏輯線交織其中:留不住人倒逼融資,融資能否止住人才失血,資本入場後將如何重塑公司基因?這是一道沒有標準答案的三重命題。
人才「精準流失」,理想擋不住高薪
表面看,DeepSeek 的人才狀況並不糟糕。V4 技術報告中 10 人標註「已離職」,以近 300 人的研發團隊為分母,整體離職率僅約 3.7%,放在任何行業都堪稱優異。但危險不在於「多少人離開」,而在於「離開的是什麼人」。2025 年下半年至今,DeepSeek 確認有至少 5 名核心研發成員離職,覆蓋基座模型、推理、OCR、多模態四條核心技術主線。
這五人幾乎構成一支完整的 AI 研發「夢之隊」:第一代大語言模型核心作者王炳宣加入騰訊混元團隊,他從零搭建了 DeepSeek 的基座模型能力
;V2 核心貢獻者羅福莉被雷軍以千萬年薪招攬至小米 Xiaomi,擔任 MiMo 大模型負責人;R1 核心研究員郭達雅入職字節跳動 Seed 團隊,擔任 Agent 方向負責人之一,職級 L8;多模態技術核心研究員阮翀加入自動駕駛公司元戎啟行,出任首席科學家;OCR 系列核心作者魏浩然也已離職。
更值得警惕的是,羅福莉並非 2025 年下半年後才離開的個案。
V4 技術報告披露前,她已於 2025 年加入小米 Xiaomi,屬於「更早離開」的核心成員。這意味著 DeepSeek 的人才失血並非短期事件,而是一個持續進行的結構性過程。如果 DeepSeek 是一個數千人的龐大組織,流失五個研究員或許只是皮外傷。但 DeepSeek 的核心研發團隊僅約 100 餘人,基座模型架構團隊更是只有小幾十人。這支團隊的構成極為特殊:本科和碩士占比超七成,30 歲以下超七成,幾乎不社招,以應屆生和實習生留任為主。
在這樣的精銳團隊中,每一個核心研究員的權重被放大到了極致。王炳宣參與過歷代模型訓練,是 DeepSeek 從 0 到 1 的基座搭建者;郭達雅是 V2、V3、R1 系列模型的核心作者,一個人橫跨推理、代碼兩大方向。對大廠而言,流失一個核心研究員是局部損失;對 DeepSeek 而言,流失一個核心研究員意味著整條技術線出現斷層。
人才流失的直接後果,是技術迭代節奏被打亂。
V4 模型從原定 2026 年 2 月中旬上線一再推遲,直至 4 月 24 日才發佈預覽版。一度以「月更模型」聞名的 DeepSeek,2025 年 12 月至 2026 年 3 月期間大版本迭代為零,同期 OpenAI 迭代 4 次,Anthropic 至少 2 次。
當然,V4 延遲不能簡單歸咎於人才流失——V4 選擇了一條極其艱難的國產化道路,完全基於華為昇騰芯片訓練,工程師們需要完成從英偉達 CUDA 生態向華為 CANN 架構的底層遷移。
但不可否認,核心人才流失與模型延遲之間,存在不容忽視的關聯。
首輪融資,本質是一場「人才保衛戰」。隨後,DeepSeek 的融資進程如同火箭躥升:4 月初,啟動首輪融資接觸,初始估值約 100 億美元,原計劃僅募資 3 億美元用於期權發放;4 月下旬,騰訊、阿里等巨頭入局洽談,估值快速抬升至 200 億美元;5 月上旬,大基金洽談領投,估值直接跳升至 450 至 515 億美元(US$45 (約 HK$351) 億至 51.
5 億,約 HK$351 億至 401.7 億)。
參與談判的潛在投資方包括國家大基金、騰訊等互聯網巨頭,以及其他國資背景基金。更引人注目的是,創始人梁文鋒計劃個人出資約 200 億元人民幣,約 HK$218 億元,佔本輪募資總額的 40%,為估值托底。融資完成後,梁文鋒的直接持股由 1% 提升至 34%,最終受益股份達 84.29%,表決權比例 100%,牢牢掌握公司的絕對控制權。
國家大基金此次選擇領投 DeepSeek,釋放了強烈的戰略信號——這是大基金首次公開佈局國內頭部大模型公司,標誌著國家資本正從硬件補短板轉向軟硬件協同建生態。
而對於 DeepSeek 來說起融資的三大核心目的:第一,期權定價,最核心的目標。融資前,DeepSeek 的員工期權沒有市場化估值,是一紙無法兌現的「期票」。融資後,450 億美元的投後估值將徹底改變這一局面——每股期權有了明確的價格標籤,員工終於能看到「紙面財富」變成現金的路徑。
據知情人士透露,這輪融資的核心目標就是「為全員期權做一個市場定價」,梁文鋒自掏腰包為這個價格托底。
第二,算力補血,最現實的痛點。隨著大模型參數規模持續擴張,訓練與推理成本同步飆升。幻方量化雖然能在一定程度上為 DeepSeek 輸血——僅 2025 年一年就在 700 億元人民幣,約 HK$763 億元管理規模基礎上實現了超 55% 的收益——但面對 V4 萬億參數模型的訓練成本和不斷增長的推理需求,單一金主的支援終究有限。
外部融資補上了這個「燒錢」缺口。
第三,行業對標,最緊迫的需要。當字節跳動憑藉 Seed 團隊的期權體系大規模吸引 AI 人才、騰訊以 CEO 辦公室直屬 AI 實驗室靈活佈局、阿里千問團隊持續擴張時,DeepSeek 如果不獲得資本背書,將在人才爭奪戰中徹底喪失出價能力。融資不僅是籌錢,更是獲得與科技巨頭在同一条跑道上競爭的入場券。
資本介入,三大風險直擊命脈。
梁文鋒此前多次公開表示拒絕外部融資,核心立場是「杜絕資本干預技術路線、避免短期商業化裹挾長期 AGI 研發」。資本市場講的是盈利、ROI 和退出路徑。當 DeepSeek 被綁上 450 億美元估值的快車,投資人期待的將不僅是在技術上領先,更是在商業上兌現。V4 發佈後,DeepSeek 已大幅降低產品價格,「其使用成本遠低於美國競爭對手,價格比 OpenAI 產品低 97%」,這被分析人士解讀為吸引企業用戶、開發者和 Agent 用戶的策略。
同時,公司計劃在 6 月推出 V4.1 版本,正式整合多模態能力和商業化能力,「從能聊天升級到能幹活」。商業化步伐明顯提速,這與當初「不做商業、純搞 AGI」的初心形成了微妙張力。
因此,融資對於企業來說是一把雙刃劍。短期看,期權定價讓現有員工受益;但長期看,融資本身拉高了整個行業的薪酬天花板。DeepSeek 的 450 億美元估值,意味著後續招聘和留人成本將指數級上升。
當競爭對手可以參考這一估值來出價時,DeepSeek 自身反而可能陷入「融資→加薪→再融資」的循環。更棘手的是,DeepSeek 原本以「技術信仰」凝聚團隊,當薪酬體系全面向大廠看齊後,那種「我們不一樣」的理想主義凝聚力是否還能持續?艾媒諮詢數據顯示,2025 年中國 AI 智能體市場規模已達 804 億元人民幣,約 HK$875.36 億元,同比增長 123.
2%,預計 2030 年將突破 6000 億元人民幣,約 HK$6540 億元。千億級市場的開啟意味著人才需求只會更大,博弈也將更激烈。
融資前,DeepSeek 是一家可以「任性」的公司——創始人說了算,研發節奏自己定,不求商業化回報。融資後,外部董事的介入、投資者的預期管理將成為必須面對的現實。雖然梁文鋒依然手握超 84% 的股份和 100% 表決權,短期內控制權不會旁落,但資本的影響力從來不只是股權數字。
當投資人期待技術變現、當市場緊盯商業化進展、當媒體用商業指標衡量公司價值——DeepSeek 的「技術浪漫主義」文化將面臨持續的外部壓力。那些最初被「做改變世界的研究」所吸引而來的人才,可能會發現公司慢慢變得和他們當初想要逃離的大廠越來越像。
450 億美元的估值是一個沉重的「錨」。這一估值是在短短幾周內從 100 億美元快速躍升而來的,市場對 DeepSeek 的增長預期被推至極高水平。
如果 V4 系列的商業化表現不及預期,如果後續模型迭代速度無法匹配競爭節奏,高估值不僅會引發資本市場的估值回調,更危險的是——期權價值縮水將直接導致人才的二次流失。屆時,融資非但不能留人,反而會加速團隊的瓦解。這也是為何梁文鋒選擇自掏 200 億元人民幣,約 HK$218 億元參與認購的深層邏輯——他需要用自己的「真金白銀」為這個估值托底,向團隊和市場傳遞一個明確信號:「我對公司的未來有絕對信心。」

