字節跳動秘密使用 OpenAI 技術打造自已的 AI

十斗
18/12/2023

TikTok 在生成式 AI 競賽中明顯落後，因此一直秘密使用 OpenAI 的技術來開發自己的競爭性大型語言模型（LLM）。

這種做法在 AI 界通常被視為失禮行為，而且直接違反了 OpenAI 的服務條款，該條款明確禁止使用其模型輸出「用於開發與我們產品和服務競爭的任何人工智能模型」。字節跳動通過微軟購買 OpenAI 的訪問權限，而微軟也有同樣的政策。根據字節跳動內部文件確認，OpenAI API 已被用於開發其基礎 LLM，代號為「種子項目」（Project Seed），在每個開發階段中幾乎都用於模型的訓練和評估。

參與其中的員工對其影響心知肚明；我在字節跳動內部員工溝通平台 Lark 上看到了有關如何通過「數據去識別化」來「美白」證據的討論。濫用情況如此猖獗，以至於「種子項目」的員工經常達到 API 訪問的最大限額。

想睇更深入嘅 AI 模型與工程科技報道？

前往 The Base Principle 繁體中文 AI 新聞 →

十斗

十斗是 TechRitual Hong Kong 科技記者，擁有計算機科學與工程學位，專注報導 AI 人工智能、Google、機器學習及數據科學領域。持續追蹤全球 AI 產業動態，為讀者提供深入淺出的科技分析。

友情網站：日本語版 / TechNippon The Base Principle（AI・工程）