紐約時報要求 OpenAI 和 Microsoft 為訓練數據支付費用

紐約時報控告 OpenAI 及其密切合作夥伴(兼投資者) Microsoft ,指控其以時報的內容訓練生成式 A.I. 模型,涉嫌侵犯版權法。

在這起訴訟中,紐約時報聲稱數百萬篇文章被用於訓練 AI 模型,包括 OpenAI 的 ChatGPT 和 Microsoft 的 Copilot,而這些行為未經其同意。紐約時報要求 OpenAI 和 Microsoft 「銷毀」包含違規材料的模型和訓練數據,並承擔與「非法複製和使用紐約時報獨特有價值作品」相關的「數十億美元的法定和實際損害」。

紐約時報的投訴書中寫道:「如果紐約時報和其他新聞機構無法產出並保護他們的獨立新聞,將會產生一個無法由任何計算機或 A.I. 填補的真空。新聞的產出將減少,而對社會的代價將是巨大的。」

在一份電子郵件聲明中,OpenAI 的發言人表示:「我們尊重內容創作者和所有者的權利,致力於與他們合作,確保他們從 A.I. 技術和新的收入模式中受益。我們與紐約時報的持續對話已經取得了積極和建設性的進展,因此對於這一發展感到驚訝和失望。我們希望能找到一種互利的合作方式,就像我們與許多其他出版商合作一樣。」

生成式 A.I. 模型通過學習示例來生成文章、代碼、電子郵件、新聞等內容,而 OpenAI 等供應商則從網絡上爬取數以億計的這些示例來擴充他們的訓練集。其中一些示例屬於公共領域,而其他示例則受到限制性許可證的保護,要求引用或特定形式的補償。

供應商主張公平使用原則為他們的網絡爬取行為提供了全面保護。版權持有者則持不同意見;數百家新聞機構現在使用代碼來防止 OpenAI、Google 和其他公司對其網站進行訓練數據的掃描。

供應商和新聞機構之間的衝突已導致越來越多的法律爭議,紐約時報的訴訟是其中最新的一起。

女演員莎拉·西爾弗曼(Sarah Silverman)於 7 月加入了兩起訴訟,指控 Meta 和 OpenAI「攝取」了西爾弗曼的回憶錄用於訓練他們的 AI 模型。在另一起訴訟中,包括喬納森·弗蘭森(Jonathan Franzen)和約翰·葛里沙姆(John Grisham)在內的數千名小說家聲稱,OpenAI未經他們的許可或知情使用他們的作品作為訓練數據。還有幾名程序員對 Microsoft 、OpenAI 和 GitHub 提起了一起長期訴訟,原因是 Copilot(一個由 A.I. 驅動的代碼生成工具)是使用他們受知識產權保護的代碼開發的。

雖然紐約時報不是首家因涉嫌侵犯版權而對生成式 A.I. 供應商提起訴訟的媒體機構,但它是迄今為止參與此類訴訟的最大型出版商之一,也是最早提出生成式 A.I. 模型的「幻覺」或虛構事實對其品牌可能造成損害的機構之一。

紐約時報的投訴書引用了幾個案例,其中 Microsoft 的 Bing Chat(現稱 Copilot),其背後是 OpenAI 的模型,提供了來自紐約時報的錯誤資訊,包括「十五種最有益於心臟健康的食物」的結果,其中有十二種在任何時報文章中都未提及。

紐約時報還指出,OpenAI 和 Microsoft 實際上正在利用紐約時報的作品建立新聞發佈商的競爭對手,通過提供通常無法在沒有訂閱的情況下獲得的資訊,這些資訊並不總是被引用,有時還被剝去紐約時報用於獲得佣金的聯盟鏈接。

正如紐約時報的投訴書所暗示的,生成式 A.I. 模型往往會重複訓練數據,例如幾乎逐字逐句地複製文章的結果。除了重複,OpenAI 至少在一次意外中使 ChatGPT 用戶繞過了付費新聞內容的付費牆。

投訴書稱:「被告試圖免費乘坐紐約時報在新聞事業上的巨額投資。」投訴書指責 OpenAI 和 Microsoft 「未經付費使用紐約時報的內容來創建可以替代紐約時報並將觀眾從中挖走的產品。」

這對新聞訂閱業務和出版商的網站流量產生的影響是一項與之相關的訴訟的核心。本月早些時候,出版商對 Google 提起的一起訴訟中,被告(包括紐約時報)辯稱 Google 的 GenAI 實驗,包括其 A.I. 驅動的 Bard ChatBot 和搜索生成體驗,通過反競爭手段吸走了出版商的內容、讀者和廣告收入。

出版商的主張是有根據的。《大西洋月刊》最近的一個模型發現,如果像 Google 這樣的搜尋引擎將 A.I. 整合到搜索中,它將在不需要點擊進入其網站的情況下,對用戶的查詢作出 75% 的回答。在 Google 訴訟中,出版商估計他們可能會損失高達 40% 的流量。

這並不意味着他們在法庭上會獲得成功。OSS Capital 的創始合夥人、知識產權事務顧問希瑟·米克(Heather Meeker)將紐約時報提供的重複示例與「使用文字處理器進行剪切和黏貼」相提並論。

________

按此即看更多:AI 人工智能 新聞
按此即看更多:
免費使用 ChatGPT-4 的 6 個方法
按此即看更多:5 個「香港」免費使用 ChatGPT-4 的方法