Apple 涉及 AI 訴訟,出版商指控其濫用數據集進行訓練

根據路透社報導,出版商 Chicken Soup for the Soul 對 Apple 提起了一宗新的人工智能訴訟。訴訟指出的數據集,Apple 已表示並不支援 Apple Intelligence。出版商在加州聯邦法院指控數家科技巨頭,聲稱它們不當使用其內容來訓練人工智能系統。

根據訴狀,Apple(AAPL.O)、Google(GOOGL.O)、Nvidia(NVDA.O)、Meta Platforms(META.O)、OpenAI、Anthropic、Perplexity AI 以及 Elon Musk 的 xAI 都被指控使用了該出版商書籍的盜版副本,來訓練其聊天機器人以回應人類的提示。訴訟指控 Apple 利用這些書籍訓練其人工智能技術,並指稱這是一種明確的盜竊行為,構成了著作權侵權。

訴狀中指出,這些被告非法複製了大量的受版權保護書籍,沒有獲得授權,並利用這些盜版副本來構建和訓練其商業大型語言模型(LLMs),或優化其產品。這些被告從數千位作者的著作中獲取內容,包括暢銷作家、普利策獎獲得者和創作廣受歡迎的非虛構及虛構作品的創作者。

在訴狀中提到,Apple 的基礎模型使用了 The Pile 數據集。這些被告並未獲得授權或支付使用這些作品的費用,而是從一些類似於 The Pile、LibGen、Z-Library 和 Anna’s Archive 的影子圖書館網站下載了盜版書籍,然後將這些作品複製、解析、分析、再製作並嵌入到其大型語言模型中,以加速商業發展並在生成式人工智能的競賽中獲得優勢。

根據著作權法,這種行為是被禁止的。訴訟中提到的“Apple 基礎模型”依賴於 The Pile 和 Books 3。The Pile 這個名稱或許讓人有些印象,因為它在2024年另一宗有關人工智能訓練的指控中出現過,當時涉及的是 YouTube 影片。然而,Apple 當時表示該數據集僅用於研究目的,並未實際用於支援 Apple Intelligence 或機器學習功能。

在這起法律案件中,Apple 的這一說法是否會有所影響,目前尚不明朗,但在法庭上將會是一個重要的考量因素,結果有待觀察。


Henderson
Henderson 主要擔任「炒稿記者」的職責,以翻譯最新科技,手機 電動車等消息為每天的工作。