近日,一个规模庞大的盗版音乐档案库浮出水面,据称其中几乎囊括了 Spotify 自上线以来所有曾被用户播放过的曲目,并覆盖了该平台近乎完整的曲库。此次事件可能成为有史以来规模最大的音乐盗版事件。尽管 Spotify 已迅速封堵了被利用的漏洞,但目前尚不清楚该档案库是否还能被有效遏制或彻底下架。
该档案由知名影子图书馆搜索引擎 Anna's Archive 创建。该组织近期通过爬取 Spotify 数据,构建了一个包含 8600 万首音频文件 和 2.56 亿首歌曲元数据 的盗版音乐库。
Anna's Archive 自称继承了 Z-Library 等影子图书馆的精神,旨在保存人类知识并提升其可获取性。该组织表示,此档案库涵盖了截至 2025 年 7 月 为止几乎所有在 Spotify 上被播放过的内容。其中,2.56 亿条元数据覆盖了 Spotify 全部曲库的 99.9%,而 8600 万首实际音频文件则占平台所有被播放曲目的 99.6%。大部分音乐被编码为 160kbps 的 OGG 格式,而较冷门的曲目则仅以 70kbps 提供。
目前,这个接近 300TB 的种子文件仅包含元数据。Anna's Archive 计划未来逐步发布完整的音乐文件、专辑封面,以及用于还原原始音轨所需的其他数据。尽管该组织目前仅发布了用于“存档保存”的完整种子包,但也正在考虑开放单曲下载功能。
Spotify 已向媒体证实了此次数据泄露事件,但未透露具体影响范围。该公司已封禁了与此次事件相关的账户,并修补了 Anna's Archive 用于爬取数据的系统漏洞。
在分析这批数据后,该活动组织还披露了一些关于 Spotify 的有趣洞察,包括音乐流派分布和歌曲流行度等。例如,他们下载的大量内容似乎是AI 生成的音乐,这印证了人工智能创作内容在 Spotify 平台上日益增长的存在感。
数据显示,AI 生成曲目 可能是 2019 年后新专辑数量激增的主要原因:2019 年 Spotify 新增约 200 万张专辑,而到 2023 年这一数字已飙升至超 1000 万张。
此外,该组织爬取的 8600 万首音频文件虽几乎覆盖了所有“被播放过”的曲目,却仅占 Spotify 总曲库的三分之一左右 —— 这意味着平台上绝大多数歌曲从未被用户听过。
据黑客方面称,Spotify 上至少 70% 的歌曲从未被播放过一次。播放量最高的三首歌曲的总播放次数,甚至超过了排名最末的 2000 万至 1 亿首歌曲 的播放量总和。其他发现还包括:
约 3400 万首歌曲 被标记为“Explicit”(含敏感内容);
大量歌曲存在多个版本(如混音版、现场版等);
Spotify 上大多数曲目均为单曲(Singles),而非专辑曲目。
这一事件不仅暴露了流媒体平台在数据保护方面的脆弱性,也揭示了当代音乐生态中“海量内容”与“极度集中消费”之间的巨大鸿沟。