在美國一場有關 OpenAI 的聯邦訴訟中,Elon Musk 在證詞中承認,他創立的 AI 公司 xAI 曾利用 OpenAI 的模型,透過所謂「蒸餾」(distillation)技術來訓練自家聊天機器人 Grok,這一原本在業界心照不宣的做法如今被推到聚光燈下。
蒸餾技術成業界焦點
近日,OpenAI 和 Anthropic 不斷推動第三方透過向其開放訪問的聊天機器人和 API 高強度提問,從而訓練出新模型,這一過程在業界被稱為「蒸餾」。數月前,爭議焦點多集中在部分中國公司身上,它們被指控透過蒸餾打開開源強大模型,這些模型能力接近美國前沿產品,卻能以更低成本對外提供。但在技術圈內,許多業者早以普遍認知,美國本土前沿實驗室之間也會互相使用類似手法,以免在競爭中落後。
這次猜測至少在一例上得到印證。 在周四紐約聯邦法院的作證中,當被問及 xAI 是否使用蒸餾技術、基於 OpenAI 模型訓練 Grok 時,Musk 表示,這是「AI 公司普遍採用的做法」。當對方追問這是否可解讀為「是」時,他回應「部分是」。Musk 目前正起訴 OpenAI 及其 CEO Sam Altman 和聯合同創始人 Greg Brockman,指控他們將 OpenAI 從非營利機構轉變為營利結構,違反了最初的非營利使命。
這場審判本周開庭,Musk 的出庭作證成為其中的核心環節。 Musk 這一承認意義重大,因為蒸餾技術被視為對大模型 AI 公司的核心競爭優勢構成威脅:這些公司投入巨資建設算力基礎設施,試圖透過規模壟斷保持領先,而蒸餾卻能讓其他軟件開發者以遠低於原成本的價格,訓練出能力上「相差無幾」的模型。在此背景下,業者也不甘示弱——為獲取足夠訓練數據,前沿實驗室本身就在版權邊界反覆試探,甚至被指「雙標」,如今尤其要抵制個人合規接口將其模型「學走」。
從時間線看,xAI 成立於 2023 年,比 OpenAI 晚了好幾年,因此試圖向當時行業領頭「取經」並不意外。目前尚不清晰蒸餾行為在法律上是否構成明確違法,更現實的約束可能來自各公司對產品使用所設定的服務條款——蒸餾往往被視為對這些條款的違背,而不一定觸及成文法律本體。 面對來自中國的模型「抄襲」疑慮,OpenAI、Anthropic 和 Google 已透過「前沿模型論壇」(Frontier Model Forum)發起聯合行動,試圖共享情報、共同應對蒸餾嘗試。
據報導,這些針對大模型的蒸餾多依賴系統化、大規模的自動提問,以此推斷模型的「內部行為模式」。為遏阻此類行為,前沿實驗室正試圖識別並阻斷疑似批量、異常請求,以防模型被「竊取精華」。 截至發稿時,OpenAI 尚未就 Musk 這段證詞回應評論請求。在庭審早段,Musk 還被問及去年夏天曾做出的高調表態:xAI 很快將在能力上超越除 Google 外的所有公司。
他在庭上對全球主要 AI 供應方進行主觀排序,稱目前 Anthropic 位居第一,其次是 OpenAI 和 Google,而中國的開源模型則排在其後。相對而言,他將 xAI 描述為一家規模小得多公司,目前僅有數百名員工。




