WAV 文件结构
WAVE 是录音时用的标准的 WINDOWS 文件格式,文件的扩展名为“WAV”,数据本身
的格式为 PCM 或压缩型。
WAV 文件格式是一种由微软和 IBM 联合开发的用于音频数字存储的标准,它采用 RIFF
文件格式结构,非常接近于 AIFF 和 IFF 格式。符合 RIFF Resource Interchange File
Format 规范。所有的 WAV 都有一个文件头,这个文件头音频流的编码参数。
WAV 文件作为最经典的 Windows 多媒体音频格式,应用非常广泛,它使用三个参数来
表示声音:采样位数、采样频率和声道数。
声 道 有 单 声 道 和 立 体 声 之 分 , 采 样 频 率 一 般 有
11025Hz(11kHz)、22050Hz(22kHz)和 44100Hz(44kHz)三种。WAV 文件所
占容量=(采样频率×采样位数×声道)×时间/8(1 字节=8bit)。
WAV 对音频流的编码没有硬性规定,除了 PCM 之外,还有几乎所有支持 ACM 规范的
编码都可以为 WAV 的音频流进行编码。多媒体应用中使用了多种数据, 包括位图、音频
数据、视频数据以及外围设备控制信息等。RIFF 为存储这些类型的数据提供了一种方法,
RIFF 文件所包含的数据类型由该文件的扩展名来标 识,能以 RIFF 文件存储的数据包括:
音频视频交错格式数据(.AVI) 、波形格式数据(.WAV) 、位图格式数据(.RDI) 、MIDI 格式
数据(.RMI) 、调色板格式(.PAL) 、多媒体电影(.RMN) 、动画光标(.ANI) 、其它 RIFF 文
件(.BND) 。
WAVE 文件可以存储大量格式的数据,通常采用的音频编码方式是脉冲编码调制
(PCM)。由于 WAV 格式源自 Windows/Intel 环境,因而采用 Little-Endian 字节顺序进
行存储。
WAVE 文件作为多媒体中使用的声波文件格式之一,它是以 RIFF 格式为标准的。RIFF 是
英文 Resource Interchange File Format 的缩写,每个 WAVE 文件的头四个字节便是
“RIFF”。WAVE 文件由文件头和数据体两大部分组成。其中文件头又分为 RIFF/WAV 文
件 标识段和声音数据格式说明段两部分。WAVE 文件各部分内容及格式见附表。
常见的声音文件主要有两种,分别对应于单声道(11.025KHz 采样率、8Bit 的采样值)
和双声道(44.1KHz 采样率、16Bit 的采样 值)。采样率是指:声音信号在“模→数”转换
过程中单位时间内采样的次数。采样值是指每一次采样周期内声音模拟信号的积分值。
对于单声道声音文件,采样数据为八位的短整数(short int 00H-FFH);而对于双声道
立体声声音文件,每次采样数据为一个 16 位的整数(int),高八位和低八位分别代表左
右两个声道。
WAVE 文件数据块包含以脉冲编码调制(PCM)格式表示的样本。WAVE 文件是由样本
组织而成的。在单声道 WAVE 文件中,声道 0 代表左声道,声道 1 代表右声道。在多声道
WAVE 文件中,样本是交替出现的。
WAVE 文件的每个样本值包含在一个整数 i 中,i 的长度为容纳指定样本长度所需的最小字
节数。首先存储低有效字节,表示样本幅度的位放在 i 的高有效位 上,剩下的位置为 0,
这样 8 位和 16 位的 PCM 波形样本的数据格式。 WAVE 文件作为多媒体中使用的声波
文件格式之一,它是以 RIFF 格式为标准的。
RIFF 是英文 Resource Interchange File Format 的缩写,每个 WAVE 文件的头四个字
节便是“RIFF”。
WAVE 文件是由若干个 Chunk 组成的。按照在文件中的出现位置包括:RIFF WAVE
Chunk, Format Chunk, Fact Chunk(可选), Data Chunk。具体见下图: