Anna’s Archive 備份 99% Spotify 播放記錄,是否真的是盜版行為?

圖書館依然是實體媒介的絕佳資源,無論是書籍、音頻 CD、DVD 或其他類型的內容。然而,圖書館在如何持續為社區提供數字內容方面,仍然面臨挑戰。雖然網上有許多數字圖書館可供使用,但盜版和媒體權利持有者的正當補償等問題,使得這個過程變得複雜。自稱為「人類歷史上最大的真正開放圖書館」的 Anna’s Archive,正試圖解決這一問題。

在一個令人意外的轉折中,Anna’s Archive 宣布已備份幾乎所有在 Spotify 上的音樂。12 月 20 日的博客文章透露,Anna’s Archive「發現了一種可以大規模抓取 Spotify 的方法」,並表示團隊「看到了在這方面構建音樂檔案的角色,主要目的是保護」。該數據備份包含 8,600 萬音樂文件,Anna’s Archive 表示這代表了 Spotify 99.6% 的收聽量。

Spotify 對 Anna’s Archive 抓取其音樂文件的報導感到不滿,並指出使用「非法手段」來繞過 DRM 和版權保護。許多問題仍然懸而未決,例如 Spotify 或監管機構是否會對 Anna’s Archive 採取法律行動,或者是否會有一個「免費」的 Spotify 歌曲數據庫供普通聽眾使用。這次大規模的音樂備份,前所未有,將迫使公司、監管機構和用戶回答一個問題:什麼區分了保護與盜版?

根據 Anna’s Archive 的說法,其備份 Spotify 曲目的依據是該公司自身的流行度指標。Spotify 上有許多歌曲幾乎沒有收聽量。從這個角度來看,該檔案估算 Spotify 上最受歡迎的三首歌曲的播放量超過了底部 20 到 100 萬首歌曲的總和。總的來說,備份包含 2.56 億首曲目的元數據和 8,600 萬首歌曲的音頻文件。

音樂文件數量元數據數量存儲需求
8,600 萬2.56 億300TB

Spotify 對其流行度指標的定義為「介於 0 到 100 之間的數值,其中 100 為最受歡迎」,這是通過一個算法計算的,主要基於曲目的播放總數和最近的播放情況。雖然 Anna’s Archive 為 99.9% 的曲目備份了 Spotify 的元數據,使其成為全球最大的音樂元數據檔案,但由於存儲限制,僅對 37% 的 Spotify 音樂文件進行了備份。根據博客文章,這 8,600 萬首備份歌曲的音頻文件以 OGG Vorbis 格式編碼,流行度指標大於零的歌曲比特率為 160kbps,流行度為零的歌曲則以 75kbps 重新編碼。

值得一提的是,Anna’s Archive 在音頻文件中添加了元數據,包括「標題、網址、ISRC、UPC、專輯封面和重播增益信息」。音頻文件通常不包含自己的元數據,因此這一點尤為重要。

需要指出的是,Anna’s Archive 的備份存在多種法律問題。抓取 Spotify 數據庫違反了該公司的服務條款,移除數字權利管理(DRM)特性和分享受版權保護的材料均違反了版權法。根據定義,Anna’s Archive 的音樂備份實際上屬於盜版。Spotify 對此表示認同,並向 Android Authority 和 Ars Technica 發表聲明,指出「一項對未經授權訪問的調查發現,第三方抓取了公共元數據並使用非法手段繞過 DRM 以訪問平台上的一些音頻文件。」

Spotify 目前正在積極調查此事件,並表示將採取行動防止類似事件再次發生。Spotify 的發言人表示:「我們已實施新的防護措施以應對這類反版權攻擊,並正在積極監測可疑行為。自第一天起,我們就始終與藝術家社區站在一起對抗盜版,並積極與行業夥伴合作以保護創作者並捍衛他們的權利。」

雖然 Anna’s Archive 引用的動機是出於保護 Spotify 音樂目錄,但對於藝術家、唱片公司和流媒體服務而言,存在重大擔憂。這一備份可能會為聽眾提供不花費金錢也能收聽音樂的方式,對音樂行業造成損害。根據目前的狀況,普通聽眾在這 300TB 的備份中尋找或收聽單獨歌曲將會困難,但這種情況可能會改變。

目前還不清楚對 Anna’s Archive 的行動是否會採取法律措施。理論上,該檔案的去中心化網絡結構使其難以完全關閉。然而,涉及音樂的情況下,權利持有者和監管機構有動機保護版權材料,因為這背後涉及大量金錢。如同 2025 年 9 月,互聯網檔案館因被指控作為「非法唱片店」而和解了一場訴訟,涉案歌曲達 4,000 首。值得注意的是,Anna’s Archive 剛剛備份了 8,600 萬首歌曲。


Henderson
Henderson 主要擔任「炒稿記者」的職責,以翻譯最新科技,手機 電動車等消息為每天的工作。