互聯網的檔案庫是其基石,負責儲存知識、文化和歷史,無論平台如何變化或消失。這個週末,Anna’s Archive 宣稱已經擷取並備份了大部分的 Spotify 數據,這一使命與現代音樂串流服務的碰撞引發了廣泛的關注。該影子圖書館表示,已開始通過大宗的 torrents 發佈近 300 TB 的 Spotify 元數據和音樂檔案。這一公告在 Hacker News 和社交媒體上引發了震驚、擔憂和討論。
根據 Anna’s Archive 的說法,這個數據集涵蓋了超過 99% 的 Spotify 播放記錄,並稱其為全球最大的公開音樂元數據數據庫,擁有 2.56 億首曲目。該項目還被描述為世界上第一個完全開放的音樂保存檔案,擁有 8,600 萬首音樂檔案。該團體聲稱,這些檔案代表了截至 2025 年 7 月約 37% 的 Spotify 目錄,並表示優先考慮流行曲目,過濾掉少數播放或低質量的檔案,包括 AI 生成的音樂。
Spotify 確認正在調查這些聲明。週一,該公司告訴 Android Authority,正在檢查 Anna’s Archive 是否大規模擷取了其平台的數據。Spotify 表示,對未經授權的訪問進行的調查已確定第三方擷取了公共元數據,並使用非法手段繞過數字版權管理(DRM)來訪問部分音頻檔案。Spotify 正在積極調查此事件,並尚未確認檔案庫訪問了多少數據,亦未表示是否會對這些 torrents 採取法律行動。
Anna’s Archive 表示,早些時候已經發現了一種大規模擷取 Spotify 的方法,並辯稱這一機會與其保存文化材料的使命相符。該檔案庫寫道:「我們看到了這裡的角色,建立一個主要旨在保存的音樂檔案。」它將 Spotify 比作一個偉大的起點,旨在創建一個權威的 torrents 列表,以代表所有曾經製作的音樂。該檔案庫將其雄心與 LibGen 相提並論,後者被 Meta 和 Anthropic 等科技公司用來獲取盜版書籍以供 AI 訓練。
該檔案庫將此次發佈框架為一種防禦性行動,表示這些數據能夠保護人類的音樂遺產,免受自然災害、戰爭、預算削減和其他災難的摧殘。該檔案庫在 12 月首次發佈元數據 torrents,計劃接下來發佈音樂檔案,從最受歡迎的曲目開始。未來的發佈可能會包括不太流行的歌曲和專輯封面,該博客還暗示如果有足夠的興趣,將來可能會提供單獨的下載。
Spotify 表示正在加強防禦措施。該公司的發言人告訴 Ars:「我們已經實施了新的安全措施,以應對這類反版權攻擊,並正積極監控可疑行為。」該公司自成立以來,一直與藝術家社群站在一起反對盜版,並正與行業夥伴合作以保護創作者和維護他們的權利。
部分 Anna’s Archive 的用戶對此表示不安。對於大宗音樂 torrents 是否主要服務於 AI 研究者而非聽眾的擔憂正在上升。有評論者指出,已經存在自動定位和串流盜版電視及電影內容的工具。其他人則擔心該檔案庫可能陷入法律危機。一位在 Hacker News 上的高評價評論者寫道:「這太瘋狂了」,質疑 AI 公司是否影響了擷取過程,或者唱片公司是否已經以低廉的價格授權目錄用於訓練。




