没有合适的资源?快使用搜索试试~ 我知道了~
首页Speex编解码器手册 1.2Beta3版
Speex编解码器手册 1.2Beta3版

Speex编解码器手册 1.2Beta3版 The Speex Codec Manual Version 1.2 Beta 3 Speex编解码器(http://www.speex.org/)的存在是因为需要一款开源且免软件专利使用费的语音编解码器,这是任何开源软件可用的必要条件。本质上来说,Speex相对于语音正如Vorbis(注:免费音乐格式)相对于音频/音乐。不像许多其他语音编解码器,Speex不是为移动电话而设计,而是为分封网络(packet network)和网络电话(VoIP)而设计的。
资源详情
资源评论
资源推荐

Speex 编解码器手册 1.2Beta3 版
The Speex Codec Manual Version 1.2 Beta 3
1 Speex 介绍
Speex 编解码器(http://www.speex.org/)的存在是因为需要一款开源且免
软件专利使用费的语音编解码器,这是任何开源软件可用的必要条件。本质上来
说,Speex 相对于语音正如 Vorbis(注:免费音乐格式)相对于音频/音乐。不像许
多其他语音编解码器,Speex 不是为移动电话而设计,而是为分封网络(packet n
etwork)和网络电话(VoIP)而设计的。所以当然支持基于文件的压缩。
Speex 设计灵活,支持多种不同的语音质量和比特率。对高质量语音的支
持也就意味着 Speex 不仅能编码窄带语音(电话语音质量,8kHz 采样率),也能
编码宽带语音(16kHz 采样率)。
为 VoIP 而不是移动电话而设计意味着 Speex 对丢失的数据包鲁棒,但对
损坏的数据包不鲁棒。这基于在 VoIP 中数据包要么完整到达要么不能到达这一
假设的。因为 Speex 针对于多种设备,所以它复杂性适度(可调节)并且占用较少
内存。
考虑这些设计目标,我们选用 CELP 作为编码技术。其中一个主要原因是
CELP 很早就被证明在低比特率(如 4.8kbps 的 DoD CELP)和高比特率(如 16kbp
s 的 G.728)都能稳定可靠工作。
1.1 获取帮助
正如许多开源项目一样,有许多方法可以获取 Speex 的帮助,包括:
1)此文档
2)Speex 网站(http://www.speex.org/)上的其他文档
3)邮件列表:在 speex-dev@xiph.org 上于 Speex 相关主题的讨论(不
仅仅针对开发者)

4)IRC:在 irc.freenode.net 上的主频道是#speex。注意由于时间的不
同,可能需要一些时间联系某人,所以请耐心等待。
5)私下给作者邮箱 jean-marc.valin@usherbrooke.ca 发邮件,但仅限
于你不想被公开讨论的私人的或精妙的主题。
在寻求帮助之前(邮件列表或 IRC),请最好先阅读本手册(好吧,如果你看
到这了,那么这是一个好迹象)。在邮件中讨论已经在手册中具体说明的问题一
般是很不礼貌的。另一方面,如果是询问在手册中没有说清楚的问题则是很好地
(鼓励)。本手册没有包含 Speex 的方方面面,所以鼓励每个人问问题,发评论,
要求增加的新特性,或简单的让我们知道 Speex 是如何被使用的。
再说些附加的关于邮件列表的指引。在你向列表中报告 Speex 中的 bug 之
前,强烈建议(如果可能)先测试下这些 bug 在使用 speexenc 和 speexdec 命令
行工具(见第四章)下是否可复现。基于第三方代码(3rd party code)发布的 bu
g 不仅难发现,而且经常是由于与 Speex 无关的错误引起的。
1.2 关于此文档
此文档分为如下几章。第二章描述不同的 Speex 特征并定义此文档中使用
的许多术语,第四章描述 Speex 提供的标准命令行工具,第五章包括用 libspeex
API 编程的具体说明,第七章有 Speex 相关的信息和标准。
最后三章描述 Speex 中所使用的算法。阅读这部分需要信号处理相关知
识,但对于仅仅使用 Speex 则不需要。这部分是为那些对于想了解 Speex 如何工
作或想基于 Speex 研究的人而准备。第八章解释了 CELP 后的一般思想,第九和
第十章是 Speex 的一些特性。
2 编解码器描述
这张具体描述 Speex 和它的特征。

2.1 概念
在介绍 Speex 特征之前,先介绍在语音编码中的一些概念,帮助读者更好
地理解手册的剩余部分。尽管其中一些事语音/音频处理中的一般概念,但有些
也是 Speex 中特有的。
采样率
采样率是每秒钟采集到的信号样本数,单位是 Hertz(Hz)。如果采样率
是 Fs kHz,则所采样信号的最高频率为 Fs/2 kHz(Fs/2 被称为奈奎斯特频率)。
这是信号处理中的一个基本性质,由采样定理描述。Speex 为三种不同的采样率
而设计:8kHz,16kHz 和 32kHz,分别对应窄带,宽带和超宽带。
比特率
在对语音信号编码时,比特率定义为单位时间内的比特数,单位是比特每
秒(bps)或通常的千比特每秒(kbps)。注意千比特每秒(kbps)和千字节每
秒(kBps)的区别。
质量(可变)
Speex 是有损的编解码器,意味着压缩率以输入语音信号的保真度为代价。
不像一些其他的语音编解码器,Speex 可以控制质量和比特率之间的折中。Spee
x 编码处理大多数时间由一个范围在 0 到 10 之间的质量参数控制。在不变比特
率(CBR)中,质量参数是一个整数,在可变比特率(VBR)中,质量参数是一
个浮点数。
复杂度(可变)
Speex 允许编码器拥有可变的复杂度。这通过一个范围在 1 到 10 之间的
整数控制搜索的执行来实现,类似于 gzip 和 bzip2 压缩工具的-1 到-9 选项。正
常使用情况下,复杂度为 1 的噪声等级比复杂度为 10 的噪声等级高 1 到 2 个 d
B,但复杂度为 10 的 CPU 要求比复杂度为 1 的高 5 倍。实际应用中,最好的折
中是复杂度 2 到 4,但在编码非语音声音如 DTMF 声调时更高的复杂度经常被
用到。
可变比特率(VBR)

可变比特率(VBR)允许编解码器自适应的根据待编码音频的“难度”动态
地改变比特率。在 Speex 例子中,像元音和高能瞬态变化的声音需要高比特率以
获得好的质量,但是摩擦音(如 s,f)用低比特率就能充分编码。由于这一原因,
VBR 在相同的质量下能获得更低的比特率,或在不变比特率下获得更好的质量。
除了这些优点,VBR 有两个主要缺点:第一,在指定质量情况下,无法保证最终
的平均比特率;第二,在一些如网络电话(VoIP)这样的实时应用中,依赖于最
大比特率,这在通信信道中必须足够低。
平均比特率(ABR)
平均比特率解决了 VBR 中的第一个问题,它动态地调整 VBR 质量以获得
指定的比特率。因为质量和比特率是实时调整的(开环的),ABR 的全局质量比
正好达到目标平均比特率的 VBR 编码质量稍微差些。
声音活动检测(VAD)
当被激活时,VAD 检测待编码的音频是语音还是无声/背景噪声。VAD 在
VBR 编码中默认激活,所以这一选项仅对非 VBR 编码有效。在这种情况下,Sp
eex 检测出非语言段并仅使用足够复现背景噪声的比特率进行编码,这叫“柔化
噪音生成”(CNG)。
断续传输(DTX)
断续传输室 VAD/VBR 的附加操作,当背景噪声平稳时会完全停止传输。
在基于文件的操作中,既然我们无法停止写文件,则对于平稳背景噪声帧仅用 5
比特(对应 250bps)。
知觉增强
知觉增强是解码器的一部分,当被启用时,能减少编解码过程中产生的噪
声或失真的知觉。在大多数情况下,知觉增强会带来声音客观上的偏离(如仅考
虑 SNR),但最后仍听起来更好(主管增强)。
等待时间和算法延时
每一个语音编解码器在传输中都会引入延时。对于 Speex,延时等于帧长
加上处理每一帧需要前几帧的数量。在窄带操作中(8kHz),延时为 30ms;在
宽带操作中(16kHz)延时为 34ms,这不包括编解码帧时的 CPU 时间。

2.2 编解码器
Speex 的主要特性有:
1)免费软件/开源,免专利费和版税
2)利用嵌入比特流集成了窄带和宽带
3)大范围可用比特率(从 2.15kbps 到 44kbps)
4)动态比特率转换(AMR)和可变比特率操作(VBR)
5)声音活动检测(VAD,与 VBR 集成)和断续传输(DTX)
6)可变复杂度
7)嵌入宽带结构(可伸缩采样率)
8)32kHz 超宽带采样率
9)强度立体声编码选项
10)定点实现
2.3 预处理器
这是在 1.1.x 版本中已经介绍的预处理器模块。预处理器在对音频编码前
对音频进行预处理,有三个主要功能:
1)噪声抑制
2)自动增益控制·(AGC)
3)声音活动检测(VAD)
解码器能减少输入信号的背景噪声。预处理能得到高质量语音,而不管降
噪后的信号是否通过 Speex 编码。然而,先降噪再进行编解码是有好处的,因为
Speex 编解码器通常会对噪声输入同样进行编解码,这将会扩大噪声,而降噪能
大大减少这一影响。
剩余47页未读,继续阅读













ccwRadar
- 粉丝: 144
- 资源: 41
上传资源 快速赚钱
我的内容管理 收起
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助

会员权益专享
最新资源
- Xilinx SRIO详解.pptx
- Informatica PowerCenter 10.2 for Centos7.6安装配置说明.pdf
- 现代无线系统射频电路实用设计卷II 英文版.pdf
- 电子产品可靠性设计 自己讲课用的PPT,包括设计方案的可靠性选择,元器件的选择与使用,降额设计,热设计,余度设计,参数优化设计 和 失效分析等
- MPC5744P-DEV-KIT-REVE-QSG.pdf
- 通信原理课程设计报告(ASK FSK PSK Matlab仿真--数字调制技术的仿真实现及性能研究)
- ORIGIN7.0使用说明
- 在VMware Player 3.1.3下安装Redhat Linux详尽步骤
- python学生信息管理系统实现代码
- 西门子MES手册 13 OpcenterEXCR_PortalStudio1_81RB1.pdf
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈



安全验证
文档复制为VIP权益,开通VIP直接复制

评论2