在音乐流媒体主导的今天,当我们谈论高品质音乐时,往往首先想到的是 FLAC 或高码率的 MP3。然而,在专业录音棚、广播系统以及考古级的音频档案中,有一种诞生于 30 多年前的文件格式依然占据着统治地位 —— 它就是 WAV (Waveform Audio File Format)。
尽管它以体积巨大著称,但在追求极致音质的领域,WAV 依然是无可争议的黄金标准。
WAV 格式的故事要追溯到 1991 年。当时,个人电脑的多媒体浪潮刚刚兴起,微软(Microsoft)和 IBM 联手推出了一种基于 RIFF (Resource Interchange File Format) 规范的文件格式,专门用于在 Windows 系统上存储音频数据。
简单来说,WAV 是 RIFF 规范在音频领域的具体应用。就像是一个标准的集装箱(RIFF),里面装载了未经压缩的原始声音波形数据。由于其结构开放、兼容性强,它迅速成为了 Windows 平台上的标准音频格式,并随后被 macOS 和 Linux 等操作系统广泛支持。
WAV 格式最大的特点,也是它最显著的缺点,就是通常不进行压缩(或者仅使用无损压缩)。
WAV 文件直接记录声音的波形。如果把 MP3 比作经过精修的照片(去除了人眼不易察觉的细节以减小体积),那么 WAV 就是相机的 RAW 格式底片,保留了录音现场的所有细节。
标准的 CD 音质 WAV 文件通常采用 44.1kHz 的采样率 和 16bit 的位深,立体声双声道。这种高保真带来的代价是巨大的存储空间。一分钟的立体声 CD 音质 WAV 文件,大小约为 10MB 至 12MB。相比之下,同样时长的 MP3 文件可能只有 1MB 左右。
随着网络速度的提升和存储成本的下降,WAV 的体积问题在专业领域已不再是大碍。然而,在大众消费领域,它确实面临着挑战。
与 MP3 拥有完善的 ID3 标签(可嵌入歌手、专辑封面、歌词)不同,传统 WAV 格式对元数据的支持较为简陋。虽然现代标准(如 BWF, Broadcast Wave Format)已经扩展了其功能,使其能包含时间码和详细注释,但在普通音乐播放器中,WAV 文件往往只显示文件名。
Spotify、Apple Music 等平台为了节省带宽,主要使用 AAC 或 Ogg Vorbis 等有损格式,或在高端服务中使用压缩效率更高的无损格式(如 FLAC、ALAC)。FLAC 能在保持音质的同时将体积缩小一半,因此在发烧友圈子里逐渐分流了 WAV 的部分份额。
尽管面临竞争,WAV 的地位依然稳固。
在广播电视领域,BWF (Broadcast Wave Format) 是 WAV 的增强版,已成为全球电视台交换音频素材的标准格式,因为它能完美嵌入时间码,确保音画同步。
在 AI 语音识别和合成模型的训练中,研究者更倾向于使用未压缩的 WAV 数据,以避免压缩伪影干扰算法的学习。
虽然在日常生活中,我们更习惯使用加工后的成品(MP3/AAC),但在创造这些成品的源头,WAV 始终是那个最坚实、最纯粹的起点。只要人类还追求声音的真实还原,这位来自 1991 年的“老将”,就永远不会退休。