没有合适的资源?快使用搜索试试~ 我知道了~
二进制搜索矢量量化的研究与应用
© 2014年。出版社:Elsevier B.V.由美国应用科学研究所负责选择和/或同行评审可在www.sciencedirect.com在线获取ScienceDirectAASRI Procedia 8(2014)112 - 1172014年AASRI体育工程和计算机科学会议(SECS 2014)二进制搜索矢量量化顾宁云,张顺杰,沙 -Hwa Hwanga, *aNTUT,电气工程#1,Sec.上海市徐汇区忠孝东路3号中华民国台北市摘要提出了一种基于二叉搜索空间的矢量量化快速搜索算法(BSS VQ)。729标准中的线性谱对(LSP)编码器采用了折衷和学习方面(TLA)的改进方法。在权衡方面,发生在量化质量的轻微损失,但是,实现了大量的计算节省。在学习方面,使用学习过程开发了二分搜索空间,该学习过程使用全搜索VQ(FSVQ)作为推断函数。在实验中,实现了86.19%的计算节省和98.15%的量化精度,这证实了BSS VQ方法的优异性能。© 2014作者。出版社:Elsevier B. V.这是CC BY-NC-ND许可下的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/3.0/)。美国应用科学研究所科学委员会负责同行评议关键词:二分查找; G.729;线谱对;语音编解码;矢量量化;1. I介绍矢量量化(VQ)以其优良的率失真性能和简单的结构成为多媒体通信中一种有效的有损量化方法。然而,全搜索算法具有大量的计算需求。因此,许多研究都集中在计算节省,可以通过使用矢量量化的方法。在现有的快速搜索方法中,树结构矢量量化(TSVQ)方法[2]被提出来减少矢量量化搜索空间。TSVQ码书的搜索空间被减少到2log2(N),这使得* 通讯作者。联系电话:+886930204341。电子邮件地址:s94310393s@hotmail.com。2212-6716 © 2014作者出版社:Elsevier B. V.这是CC BY-NC-ND许可下的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/3.0/)。美国应用科学研究所科学委员会负责的同行评审doi:10.1016/j.aasri.2014.08.019Ning-Yun Ku et al./AASRI Procedia 8(2014)112113方法强大;然而,该方法的量化质量损失是有问题的。TSVQ是一种二叉搜索方法,它使用单个路径遍历适当的码字。因此,TSVQ编码器不确保所选码字最接近输入向量。以前的研究[1]将三角不等式消除(TIE)应用于基于矢量量化的图像编码,实现了超过90%的计算节省。然而,TIE方法依赖于输入信号的相关特性。类噪声(弱相关特性)输入向量降低了TIE方法的性能。在文献[3]中,提出了准二分搜索(QBS)算法和TSVQ与TIE之间的折衷方案,以降低VQ算法的计算复杂度。性能优于TIE,特别是关于噪声类输入信号。QBS算法不依赖于输入信号的相关特性。虽然QBS算法的量化精度为99.16%,这是相当不错的,但G.729标准的LSP编码器的59.43%的计算节省是不令人满意的。虽然VQ是一种强大的方法,但它在为G.729标准的LSP编码器节省计算量方面面临许多问题。首先,移动平均(MA)过滤LSP参数,然后冗余源数据被提取和删除。MA滤波器由此消除LSP的偏置的相关特性。因此,这些基于TIE的算法的性能在G.729标准中降低。第二,在G.729标准的多级VQ中提供小的码本大小。所有码字都是相邻的,并且彼此接近;因此,TIE算法不能有效地工作。第三,TSVQ实现了相当大的计算节省,但损失了大量的量化质量。QBS方法损失轻微的量化质量,并实现不令人满意的计算节省。另一项研究[4]提出了VQ的快速搜索方法。然而,这些方法中没有一个关注G.729标准的LSP编码器。本文提出了一种二叉搜索空间矢量量化(BSS-VQ)的方法,它平衡的计算节省和量化质量,并实现了相当大的计算节省,只有轻微的损失,在量化质量。此外,神经网络和矢量量化的学习方面也被用来提高BSS矢量量化方法的性能。采用G.729标准的LSP编码器验证了BSS-VQ的性能。以下部分描述BSS-VQ算法。最后两节给出了实验结果和结论。2. BSS矢量量化算法本节提出了一种快速搜索BSS-VQ算法,该算法采用快速定位方法来确定小的搜索空间,并对其进行充分搜索以获得最佳匹配的码字。提出了一种基于全搜索矢量量化(FSVQ)的盲源分离算法。BSS使用大量训练数据进行训练,有效地获得每个子空间的码字。然而,在分裂边界和码字边界之间存在一些微小区域,这意味着训练数据落入微小区域的可能性很小。因此,训练不足的学习算法可能会导致训练过程中没有训练数据落入的微小区域中的编码丢失,导致量化精度下降;相反,使用训练数据充足的学习算法可以完全训练每个子空间,但它具有高度重叠的码字;具有高度重叠码字的BSS导致计算节省下降。基于上述分析,算法1描述了BSS-VQ算法中学习过程产生的BSS。算法2,关于BSS-VQ编码过程中,也详细介绍。114Ning-Yun Ku et al./AASRI Procedia 8(2014)1122.1. 算法1:用于BSS-VQ步骤1:BSS确定。步骤1.1:选择第1001章:你是我的女人(1)其是VQ的原始码本,以训练BSS。项N是码本大小,D是码字维度。步骤1.2:计算ଵσ日本语中文(简体)ǡ作为CB在第j维中的质心。步骤1.3:确定(三)ʹሽȁͳሼ作为BSS,其根据质心Cj从二分法分裂产生。BSS包含2D在初始化阶段没有码字的子空间。步骤1.4:清空第1044章:你是我的女人(4)作为训练放置统计,其用于确定推断值落入cwi的频率好吧第二步:学习过程。步骤2.1:术语第1005章:一夜情(5)作为训练数据库,S用于构建BSS的内容码字,其中si是D维向量,M是数据数。M是一个很大的数字,表示训练数据足以完全训练每个二叉搜索子空间。步骤2.2:获取(六)ሻሺݓNing-Yun Ku et al./AASRI Procedia 8(2014)112115ୀୀଵୀୀଵ术语FSVQ(si)表示全搜索VQ算法。它用于从输入向量si的CB确定最佳匹配码字cwn。步骤2. 3:确定(七)ሻሺσ ʹ· ሺሻǡ ሺ ሻͲǡǡͳǡǡ(八)本文提出了一种BSSVQ(si)算法,用于确定输入向量锡岛BSSVQ(.)只需要D次比较。步骤2.4:设置(九)ݓ并将TPSp,n增加1。如果cwn不属于好吧步骤2.5:对每个输入向量si重复步骤2.2至2.4,直到i=M。TPS的总和最终是M步骤2.6:标准化ǡʹ ǡ ͳȁͳ ሻݐሺǡ Τσሻݐሺݑǡݐ(十)步骤3:BSS筛选。步骤3.1:表示第1111章:你是我的女人(11)作为学习的二进制搜索空间,其中,Ni是在Ni中的码字的数量。设置最佳阈值gsn和步骤3. 2:排序为1。排序后的(十二)ቅͳͳǡǡݐǡݐȁǡቄTps i的码字按tps i降序排序。步骤3.3:筛选筛选新(十三)หͳǡ116Ning-Yun Ku et al./AASRI Procedia 8(2014)112ୀୀଵ术语ቊǡ (十四) ǡୀାଵǡݐ ǡݐห是有效的searc hsu bs步伐。通过阈值kvss来过滤出不太可能的子块,该阈值kvss包含不太可能的kv1码字。步骤3.4:重复步骤3.2至3.3,直至i=2D。2.2. 算法2:BSS-VQ编码过程步骤1:表示日本语简体中文繁体中文한국어作为输入信号,其中xi是D维向量。第二步:确定ሻ ǡݔሺσʹ ȉ ሺݔሻ(十六)哪里ሺݔ ሻͲǡݔ ǡͳǡݔ ǡ(十七)BSSVQ(.)函数用于确定子空间的最小值,并与成本D倍比较。第三步:获取(十八)ሻݔሺ将子空间FSVQ内的所有码字设置为新码本,并且将FSVQ(.)随后被用于从Rwq中获得最佳匹配的码字cwm。该子空间的码字数小于原码本的码字数。因此,计算复杂度大大降低。步骤4:对每个输入向量xi重复步骤2和3,直到i = t。3. 实验结果本研究使用G.729标准中的LSP编码器,具有10-D码本和128个码字来验证BSS-VQ的性能。在内部测试中使用了以8 kHz的采样率和16位的分辨率记录的语音数据库;它包含男性语音、女性语音、背景噪声和沉默,其数据数M为601422(45.8MB)。训练的二进制搜索空间的平均、最小和最大码字数分别为16.53、8和26此外,15.3 MBNing-Yun Ku et al./AASRI Procedia 8(2014)112117语音数据为外部测试数据,验证了BSS-VQ的性能。如表1所示,实现了86.19%的计算节省和98.15%的量化精度。当量化精度相似时,BBS-VQ的计算节省优于QBS-VQ方法。此外,当计算量节省相似时,BSS-VQ的量化精度优于TSVQ。这些实验结果证实了BSS-VQ方法的优异性能。表1. G.729标准LSP编码器在FSVQ、TIE、QBS、BSSVQ和TSVQ算法的外部测试中的计算节省计算节省量化精度FSVQ0%的百分比百分百TIEVQ23.65%百分百TSVQ89.06%46.61%QBSVQ59.43%百分之九十九点一六BSS-VQ86.19%百分之九十八点一五4. 结论本文提出了一种BSS-VQ算法来增强G.729标准的LSP编码器。权衡和学习方面被用来实现最佳性能。BSS-VQ算法不依赖于输入信号的相关特性,并且优于G.729标准的LSP编码器中的大多数现有算法。引用[1] Choi,S.Y.和Chae,S. I.基于三角不等式的增量搜索快速矢量量化器。电子学快报,1192-1193; 1998年。[2] Djamah,M.和O,D。嵌入式向量量化之有效树状码书设计。IEEE International Conference onAcoustics Speech and Signal Processing(ICASSP),4686-4689; 2010。[3] Yan,L.J.和Hwang,S.H.二进制矢量量化。第三届IEEE国际研讨会论文集通信,控制,信号处理(ISCCSP),604[4] 陈淑珊和Li,F.W.使用子矢量特征和Hadamard变换的图像矢量量化的快速编码方法。IETImage Processing,18-24; 2011。
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- Aspose资源包:转PDF无水印学习工具
- Go语言控制台输入输出操作教程
- 红外遥控报警器原理及应用详解下载
- 控制卷筒纸侧面位置的先进装置技术解析
- 易语言加解密例程源码详解与实践
- SpringMVC客户管理系统:Hibernate与Bootstrap集成实践
- 深入理解JavaScript Set与WeakSet的使用
- 深入解析接收存储及发送装置的广播技术方法
- zyString模块1.0源码公开-易语言编程利器
- Android记分板UI设计:SimpleScoreboard的简洁与高效
- 量子网格列设置存储组件:开源解决方案
- 全面技术源码合集:CcVita Php Check v1.1
- 中军创易语言抢购软件:付款功能解析
- Python手动实现图像滤波教程
- MATLAB源代码实现基于DFT的量子传输分析
- 开源程序Hukoch.exe:简化食谱管理与导入功能
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功