没有合适的资源?快使用搜索试试~ 我知道了~
制作和主办:ElsevierJournalof King Saud University沙特国王大学沙特国王大学学报www.ksu.edu.sawww.sciencedirect.com抖动多维信号的一般方案,以及使用有限调色板Mohamed Attiaa,b,c,*,1,2, Waleed Nazihd,3, Mohamed Al-Badrashinye,4,Hamed Elsimaryd,3a埃及吉萨RDI计算机系统开发工程公司b卢克索技术公司,Oakville,Ontario L6L6V2,Canadac阿拉伯科学技术学院,赫利奥波利斯校区,埃及d计算机工程和科学学院,Salman bin Abdulaziz大学,AlKharj,沙特阿拉伯阿卜杜勒-阿齐兹国王科技城(KACST),利雅得,沙特阿拉伯接收日期:2013年3月12日;修订日期:2013年8月30日;接受日期:2013年2013年12月12日在线提供摘要本文的核心贡献是介绍了一种基于软矢量聚类的多维信号抖动的通用整洁方案,该方案适用于任意维数的任何空间,任意数量和分布的量化质心,并与计算机一起使用。可控的量化噪声。一维和多维信号数字化时的抖动将量化噪声分散在频域上,使其不易被信号处理系统(包括人类认知系统)察觉,因此它对通信、控制、机器学习等重要领域产生了非常有益的影响。将我们的多维抖动方案的行为可视化是非常可取和有见地的,特别是量化噪声在频域上的分散。通常,这种可视化将很难实现并被读者感知,除非*对应 作者 地点: 卢克索 技术 股份有限公司、 奥克维尔,加拿大安大略省。联系电话:+1 6475349166。电子邮件地址:m_atteya2004@yahoo.com,m_atteya@rdi-eg.com(M。Attia)。1www.RDI-eg.com。2www.AAST.edu.3www.sau.edu.sa。4www.KACST.edu.sa。沙特国王大学负责同行审查沙特国王大学。制作和主办:Elsevier B.V.All rightsreserved.http://dx.doi.org/10.1016/j.jksuci.2013.12.002关键词数字信号处理;数字图像处理;抖动;多维信号;量化噪声;软向量聚类12L12Q8qq8问我0k;1≤ k≤L2用于抖动多维信号的一般方案,以及编码图像203的可视实例目标多维信号本身可被人直接感知。因此,我们选择将多维抖动方案应用于编码真彩色图像2013年沙特国王大学。制作和主办:Elsevier B.V.All rights reserved.1. 介绍本文的主要贡献是介绍了一种通用的用于多维信号抖动的整洁方案,该方案能够处理任意维数、任意数量和分布的量化质心,并且具有可计算和可控的噪声功率。为了继续介绍这种新颖的多维抖动方案,有必要首先正式审查一维信号数字化,量化噪声和抖动。模拟一维信号的数字化-- 旨在将其动态范围q min 6 q 6 q max内的信号的任何给定样 本 映 射 到 预 定 义的 量 子 能 级 集 合 {c1 , c2 , .. . , ci,.. . ,cL};qmin6ci6qmax,LP2。为了使数字化误差最小化,该映射通常通过最小距离标准来完成;即,信号样本被映射到最近的量子能级,其可以用公式表示如下:A到Dq-!i0:i0¼arg8minfdq;ckg;1其中d(q1,q2)是任意合理的距离标准,q;qffi.给定信号样本的数字化1D空间被简化为一个简单的选择-包 围 该 信 号样 本 的 两 个 量 子 能 级 ( Ro b e r t s , 20 0 7 ;Wid r o w an d Ko ll a 'r ,20 0 8 ),如下图1 所示。所有出现的信号样本的平方数字化误差之和构成量化噪 声 , 其 公 式 如 下 (Roberts , 2007;Widrow 和 Kolla'r ,2008):如果数字化信号是预定用于人类感知的,例如数字音频,则质量下降,或者如果数字化信号被转发到某些进一步的处理,则可能变成严重的误差源;例如,机器学习、控制系统等。例如,考虑单个音调的音频信号500赫兹的纯正弦波。在频域中,该模拟信号在500 Hz处显示单个脉冲,而在其他地方则没有。当此音频信号通过16位量化进行数字化时,即: 216 = 65,536个量子能级,频域中产生的数字信号似乎(几乎)与图顶部蓝色曲线所示的原始模拟信号相同。 二、 另一方面,当相同的音频信号通过6位量化进行数字化时;即,2 × 6= 64个量子级,频域中的所得数字信号在500 Hz处示出主峰,但也示出其他相当大的谐波,如图1中间的红色曲线所示的4500 Hz附近的谐波。 二、这些突出的谐波意味着数字化信号不再对应于纯单音,而是对应于一个复合信号,其中刺激性的假哨声叠加在原始的纯音上(Pohlmann,2005)。几十年来,研究人员和工程师已经认识到,这个问题是由信号的窄带内的数字化误差的集中引起的,并且因此已经认识到,将数字化误差分散在频域中的较宽频带上将产生更好的数字化信号,其中突出的伪影不那么明显。通过这种方式数字化信号,人类将感知到更好的质量,并且数字信号处理系统将更稳健地执行。在较宽的频带上分散数字化误差通常是通过在模数转换之前向模拟信号添加受控噪声来实现的(Petri,1996;E2¼Xe2q¼Xq-c:2舒克曼, 1964年)。 这 过程 是 普遍 称为‘‘dithering’’量子能级集合在信号的动态范围上的分布可以是规则的,– variant adds to each analog signal sample q someci¼qminq_(max)-q_(min),则称为正则量子。包围量子能级C1和C1-1。数字化与此抖动的类型可以用公式表示如下:是的。当出现的信号样本的分布是数字化是非常不规则的,数量的分布,iωar gminnd.q阿克伦湾。ci-1-ci;ci-ci-1;co:3调谐电平可以被设计为跟踪出现的样本中的不规则的一个样本,然后被称为自适应量化。508k:i-1 ≤k≤i22k自适应量化的目标是最小化任何给定数量L的量子能级的量化噪声(Roberts,2007;WidrowandKolla'r,200 8)。增加L明显地降低了数字化误差和量化噪声两者;然而,在给定数字化方案中部署的L的大小存在硬件和/或计算成本限制当L不足以充分捕获模拟信号的分辨率时,数字化信号会受到干扰性伪影的影响,使其信息内容与原始模拟信号所携带的信息内容相比明显失真这可能会变成一个严重的数字化 与 抖动 的 一 给定 信号 样品描述Eq. (3)仍然是包围该信号样本的两个量子水平之一的选择;然而,与Eq.(1)这种选择是一个随机过程,其中将样本归因于两个量子能级中的每一个的机会由下式给出:[5]图1中的量子能级分布被假定属于第二种量子化。图1一维空间中的抖动;只有两个封闭的量子能级竞争给定的点。.- -204米Attia等人图2量化噪声在频域上分散的抖动P.Q抖动 i-1000ci-q;P.Q抖动 我的信号数字化过程中的量化-!ci-ci-1¼1-P q!抖动i-1q-ci-1:4具有抖动的样本的量化噪声明显大于没有抖动的相同种群的量化噪声。-!ci-ci-1这种量化噪声的增加是分散0 0Y-≈j0j-12j-112D¼ ð Þ2用于抖动多维信号的一般方案,以及编码图像205的可视实例更 宽 频 带 上 的 量 化 噪 声 ( Petri , 1996;Schuchman ,1964)。将该抖动模型应用于通过6位量化对我们的示例性单音音频信号进行数字化,在频域中产生的数字信号-显然,白噪声加上干扰谐波中的总量化噪声功率增加了;然而,这种噪声在频谱上也更加分散。随着白噪声的呼啸声加上一些更微弱的突兀的哨声,原始音调在通过6位量化的数字化音频中的识别比在通过6位量化的数字化音频中的识别更清楚,而在没有抖动的情况下,更高的突兀哨声令人恼火地模糊了原始音调(Vanderkooy和Lipshitz,1987)。多维信号--出现在控制、通信、电子、机器学习、图像处理等重要领域的无数先进现代应用中。等图3在二维(或多维)空间中有规则量子化的抖动;只有外接矩形(或超矩形棱柱)的角上的量子能级竞争给定的点。给定 一个 新兴 信号 样品 q/1;q/2; q“量子点”6不够大,无法捕获12这些信号的多维分辨率。因此,下一节将讨论为什么多维信号的抖动比一维信号的抖动更具挑战性。然后,第2节继续提出我们的一般整洁方案的抖动信号在任何空间,任意维度,任意数量和距离-位于内部的矩形其四角c i-1;j-1;c i;j-1;c i-1;j;c i;j,它们都属于ffi2-- 为了在该常规量化设置内被数字化,直接增加等式(1),(3)以二维空间为数字化载体-利用q的抖动,随机地将其归因于其封闭矩形的一个角,如下所示:最小值D.q阿克伦湾。c1i-1-c1i;c1i -1 i-1 i;c1i - 1 i-1i;c1 i-1 i量子化质心的计算第3节提供了一个quan-量化噪声的定量分析,由于我们的抖动方案相比,从量化,而没有抖动018k:i-1 ≤k ≤iω2.C2-c2j21kc2j-c2Σ2价格:150元将我们的多维抖动方案的行为可视化是非常可取和有见地的,特别是量化噪声在频域上的分散。通常,这种可视化将很难实现并被读者感知,除非目标多维信号本身可被人类直接感知虽然声音信号是一维的,但图像是三维的,并且为所寻求的可视化提供了理想作为一种可视化我们的新的多维抖动方案的动态行为的手段,我们应用此方案后,编码真彩色图像与有限的颜色集的调色板,以显示它如何最大限度地减少视觉失真-特别是轮廓效应-在编码图像。第4节详细讨论了该应用。最后,第5节介绍并讨论了我们的实验结果与此应用程序的一个目录的杂项真彩色图像的比较。2. 多维信号考虑图3,其中2D空间中的质心集合6多维空间中的量化点称为质心。这个过程是可扩展的,并且适用于在任何维数的空间中的任何规则量化设置,以属性q;q. 到其封闭的超矩形棱柱的2D角之一。在这样的规则量化设置中,将信号在每个维度上的动态范围划分成(DL¼‘d1这个指数性质的公式是非常昂贵的,具有高维度,这在需要对多达几十个分量的向量进行分类的现实应用中非常常见;例如机器学习特征向量。 例如,如果我们必须通过常规量化设置在20维空间中对矢量信号进行量化,其中每个维度被适度地划分为3个区间,则需要大量的4 20 1.1·10 12质心!由于它们的超线性计算复杂度模式,现实生活中的信号处理系统倾向于处理小的质心集合,并且最多可以处理几千个质心。因此,规则量化方案很少被部署,而是采用自适应量化方案。向量聚类算法;¼ argmin8k:j-1 ≤k≤j第二季兰;;c2kn.ð Þ≥ 8 ≥¼f ð Þgð ÞK222软VQPQI2k1fd q; ckP我-我知道-我知道-!1/1-我知道即dq;c>dq;c)Pqi软VQ0:09q-!i0:i0argmindq;ck:78k;1≤k≤L另一方面,Eq. (5)在多维情况下,规则量化不能应用于多维自适应量化的一般情况,因为在不规则自适应量化设置(如图4所示的示例性设置)内不能确定地识别封闭矩形(或为了绕过这一障碍,并保持与先前剖析的基本抖动方案的最大兼容性,我们针对多维空间中矢量量化的一般情况的新抖动方案必须符合有以下三个主要限制:1.由于超矩形棱柱包围一个给定的qffiD是缺席的一般情况下,我们允许所有的质心cj2f1; 2;. ;Lg2ffiD竞争取代数字化中的q3.基于抖动抖动将量化噪声分散在数字化信号的频谱上,这对于所感知的信号质量以及对于任何后续数字信号处理的鲁棒性都是巨大的增益。然而,这种增益的代价因此,本节专门对由于我们的多维信号的一般抖动方案而产生的附加量化噪声进行定量分析,以了解其应用于此类信号的安全性。通过公式化的硬VQ进行数字化。上面,每个信号样本对量化噪声能量的局部参与由下式给出:信号表示。e¼最小值d=1000;c=10002. 这场比赛是通过什么来随机仲裁的我们称之为软VQ,以便:硬VQK8k;1≤k ≤Lmin8i2f1; 2;.. . Lg:P.q软VQi>0且PLP.q软VQi=1。由于数字化产生的总量化噪声能量通过Hard,3. 对于给定的q,更远的质心ci1具有VQ,然后由Petri(1996)和Schuchman(1964)给出:q比较近的质心c;降低更换i2的.- 是 的E¼XNmindi1i2-我知道1-我知道2通过公式化的软VQ进行数字化。上面,每个信号样本对量化噪声能量的局部参与由下式给出:7LBG是表示著名的向量聚类由Linde,Buzo和Gray开发的算法(Linde等人, 1980年)。XL.¼.ΣΣKPLd·fL8矢量信号样本的数字化也称为矢量量化或VQ速记。k¼1k1fdk2.硬VQn<$18k;1≤k≤Le软VQ¼:12001blim.Σ.2019-04-22BPLKDPPL=d-1;a千分之四Pbb b bb发生在1[1/2]b¼B一B¼ ð ÞBB2K1min我0m!1K软VQ 1KKK千分之四Kr<$k最小值i02L-12L-1≥。¼ð ðÞÞΣ8≤ ≤如前所述,抖动是一种常见的e硬VQ2min这是因为它在一维信号的数字化上是有用的。用于抖动多维信号的一般方案,以及编码图像207的可视实例在当量(十二):d2d2d q;c2k;1KL是由概率P0加权,其结果与等式(10)和(11):limr¼ 1:121 mm对于Lfi例如L=256或L=512.等-我们有以下Excel-e≤ ee软VQ)1≤r≤rE软VQ)1 ≤ ≤r:Lent近似解:硬VQ软VQe硬VQMaxE硬VQMaxð13Þ我!1a¼2·L-1=mM-2;limrmax我!1m-2m2MM-2:1220接下来的问题是研究比率r有多大,至少它的上限rmax有多大。我们的逆幂函数概率分布的选择证明是非常有用的,在简化这项任务,取代方程。(9)在Eq. (12)得到:否则,通过找到方程的峰值来数值地获得a。(16)由Eq. (17)如图illustrated的示例图表。图5. 图6. 7和图下面8个。Le软VQ 1d2-m;1400万4. 通过Soft VQ使用有限的调色板编码真彩色图像然后用Eqs代替。(14)和(10)在方程。(13),我们得到:有用的操作,以配合基本上至关重要的A-到-一维信号的D转换犹豫不定ePL200d2-m²,PL-m²L简体中文最小值M2m:1500nals;因为它在频率do上分散量化噪声main,使其不易被信号处理k¼1dmin=dk当量(15)可以更方便地改写为:系统在通信、控制、机器学习等重要领域的无数应用。 等1μPL1am-2一d¼d这是非常可取的和有见地的可视化行为1L1mdkkAttia等人(2010,2011)详细研究了Eq. (16)-其完整推导在本文末尾的Appen-Escherichi中展开-我们将其结果呈现如下:因为m <2 r可以无限大地增长,即 rmax=不考虑L的值。因此,该抖动方案不应在该范围内使用,以避免在数字化信号中产生破坏性噪声的风险对于m= 2,rmax=L,这对于少量质心可能是合适的操作点;例如L= 2或L=3,但对于大量质心则是危险的;例如L=256或L=1,024。对于m>2,存在且仅有一个r=rmax的最大值aa1;a2.. .阿 ...根 据 ( Attia 等 人 ,2012 年,2011年)-都是通过:我们的多维抖动方案;特别是dis-量化噪声在频域上的比例。在通常,除非目标多维信号本身可被人类直接感知,否则虽然声音信号是一维的,但图像是三维的,并且为所寻求的可视化提供了理想作为一种可视化我们的新的多维抖动方案的动态行为的手段,我们应用此方案后,编码真彩色图像与有限的颜色集的调色板,以显示它如何最大限度地减少视觉失真轮廓效果彩色图像通常被建模为某些颜色空间(如RGB、CIE-XYZ或CIE-Lab)中的三维信号(Hunt,1998)。术语“真彩色图像”表示其中每个颜色维度被独立地划分为255个间隔或更多的数字化图像。因此,在这样的图像中的每个像素都是像素。akj8k0a;17Þ年龄由3·log 2(255 + 1)= 24位或更多位表示。这方面的经典问题是表示这样的图像RMaxm-2:18m·2a是以下多项式的解用一组任意有限的颜色(LP2)--称为调色板–几乎所有最新的高端数字显示器都可以.. . 哪里bam. m·1·ba2-m-2·1 1/4;一操纵真彩色图像;然而,这在15年或更长时间前从未发生过。然而,仍然需要处理设备和设置的能力有限-有限m>2;L≥2;2½0;1]:119分仅对于me {4,6,8,10},该多项式具有封闭形式的精确解(Jacobson,2009);例如:对于m=4,解为:切换到一小部分颜色中的一种这里有一些例子这些设备和装置可能仍在大规模使用1. 低端数码产品的展示;例如手表、计算器、ba2.每立方米11/4磅/升 ;rmaxjm¼4 2019 -01-20 00:00:00激光器,无线/手机. . ,尤其是当这些小工具连接到万维网时。2. 具有有限颜色能力的打印设备,例如对于mf,无论L的值如何,软VQ接近硬VQ的行为,我们得到:黑白打印机和传真机。3. 通过缓慢/非常缓慢的互联网连接传输图像¼·k¼1r将多维信号数字化也可用于相同的2½0;1]:116磅KKK208米Attia等人图5我们的软向量聚类的量化噪声能量相对于两个质心(L=2)处的硬聚类的量化噪声能量,以及各种幂m值(在每条曲线上以粗体图6我们的软向量聚类的量化噪声能量相对于四个质心(L=4)处的硬聚类的量化噪声能量,以及各种幂m值(在每条曲线上以粗体图7我们的软向量聚类的量化噪声能量相对于八个质心(L=8)处的硬聚类的量化噪声能量,以及各种功率m值(在每条曲线上以粗体用于抖动多维信号的一般方案,以及编码图像209的可视实例图8我们的软向量聚类的量化噪声能量相对于32个质心(L=32)处的硬聚类的量化噪声能量,以及各种幂m值(在每条曲线上以粗体210米。Attia等人4. 操作系统的某些显示模式,例如MS-Win-Windows '安全模式,某些图像格式;例如GIF,存档图像的快速预览;例如在浏览. 这种情况只允许面向16色或256色调色板的图像显示。5. 大小马赛克和马赛克般的图像组成。6. 老式的大型电子广告牌在那些可能太贵而无法更换的地方提供服务。当使用有限的调色板经由硬VQ编码时,真彩色图像遭受图像质量的损失,因为一些图像细节的原始颜色被调色板中的不同颜色替换这不仅可能混淆图像颜色,而且还可能模糊图像的非常典型的特征。这种使用预定义调色板的编码比相同大小的自适应调色板的情况产生更严重的失真。此外,对于相同的调色板获取和编码方法,较小的调色板产生更严重的图像失真比较大的。解决这个问题的最古老的方法是半色调,它是在前数字时代发明和部署的,用于在通过单色(即黑白)印刷产生的老式印刷机上显示灰度模拟照片。半色调打印一个点,其黑色区域与图像中每个点的灰度级的暗度成比例;即空间分辨率与颜色分辨率交换。随着数字时代的出现,已经开发了更多涉及的半色调变体,以利用显示器和数字图形卡的能力,这些显示器和数字图形卡可以显示超出二进制的多个灰度级(Floyd和Steinberg,1976)。彩色图像抖动的新变体随着彩色显示器和具有更宽存储的图形卡的流行而出现。早期的这种变体独立地作用于每个颜色维度(Gentile例如,1990),并且然后已经设计出更复杂的算法来同时获取调色板并执行调色板的识别。图像数字化,使得数字化图像中的图像质量损失最小(Kollias和Anasteland,1991; Flohr和T.,1993; Ketterer等人,1998; Cheng等人, 2009年)。在这方面提供最佳结果的 算 法 通 常 被 称 为 空 间 颜 色 量 化 ( Spatial ColorQuantization)(Ketterer等人, 1998);然而,它也是数学上最复杂和计算要求最高的算法,因为它不仅仅是抖动算法,而是实际上是组合成本最小化问题的复杂解决方案。另一方面,图9描述了我们对这个问题的更简单的解决方案,该解决方案基于本文第3节中提出的通用抖动方案假设输入数字图像是RGB空间中的真彩色图像,RGB空间是用于在电子显示器上表示数字图像的最常见的颜色空间。然而,RGB空间中两个不同点(即颜色)之间的欧几里 得 距 离 并 不 对 应 于 人 类 对 这 两 种 颜 色 的 感 知 差 异(Hunt,1998)。因此,我们系统中的第一个模块M1将输入图像从RGB颜色空间转换到CIE-Lab颜色空间,其中两个不同颜色矢量之间的欧几里得距离与这两种颜色的感知视觉差异相对应(Hunt,1998)。然后,模块M 2应用LBG向量聚类算法(Linde等人,1980; Gray,1984; Gray和Neuhoff,1998)到来自M1的输出图像中的像素的CIE-Lab颜色向量的群体,以便推断给定大小L P2的最佳调色板。然后,图像中每个像素的CIE-Lab颜色向量通过我们的Soft VQ进行抖动,其中具有上面第3因此,给定幂mP2,模块M3随机地将每个CIE-Lab颜色向量q归因于调色板颜色之一ci;16i6L,其中根据等式2计算概率(8)和(9)。图9我们的系统的整体结构,用于对具有有限调色板的真彩色图像进行最佳编码。用于抖动多维信号的一般方案,以及编码图像211的可视实例图10原始真彩色图像(左上角),通过LBG聚类和硬判决最近距离VQ使用16色调色板编码的图像(右上角),通过LBG和SoftVQ编码的图像(m=2)(左下角),最后通过LB和Soft VQ编码的图像(m=3)(右下角)。图11原始真彩色图像(左上角),通过LBG聚类和硬判决最近距离VQ使用16色调色板编码的图像(右上角),通过LBG和SoftVQ(m=2)编码的图像(左下角),最后通过LB和Soft VQ(m=3)编码的图像(右下角)。212米。Attia等人图12原始真彩色图像(左上角),通过LBG聚类和硬判决最近距离VQ使用16色调色板编码的图像(右上角),通过LBG和SoftVQ(m=2)编码的图像(左下角),最后通过LB和Soft VQ(m=3)编码的图像(右下角)。模块M4将M3的输出从CIE-Lab颜色空间转换回RGB颜色空间,作为我们系统的输出。然后,M4的输出是用有限的调色板编码的数字图像,该调色板与具有任何颜色深度Plog2(L)的数字图像显示器兼容。图10示出了关于我们的解决方案的性能的说明性示例,该解决方案用于通过具有逆幂函数分布的软VQ对具有有限调色板的真彩色图像进行编码。图的左上角显示输入的原始真彩色摄影图像。右上角示出了经由具有最优(在某种意义上)的HardVQ对原始图像进行编码的结果。的最小量化噪声)16色调色板通过LBG向量聚类算法获得。严重的突出轮廓效应9是非常明显的表现9.那些由不相交的颜色阴影之间的突然过渡引起的错误边缘不足以表示颜色梯度的区域寄生谐波由于集中的量化噪声在紧密的频带内,如本文第1这种糟糕的分布不仅使原始内容对人类观众模糊不清,而且还产生了原始图像中从未出现过的虚假细节。图的左下角和右下角。图10示出了分别在(L = 16,m = 2)和(L = 16,m = 3)的情况下应用基于软VQ的抖动方案的结果。显然,在这两个图像中,轮廓效应已经以比根据等式(1)经由硬VQ获得的图像的量化噪声更高的(十三)、同样明显的是,根据等式(1),m= 3时的量化噪声低于m=2时的(十六)、m = 3的视觉质量与图2中的其他两种情况相比是减轻突出效应和限制量化噪声两者的更平衡的折衷。 10;右上角的那个太多了用于抖动多维信号的一般方案,以及编码图像213的可视实例图13“Peppers”的原始标准测试图像图14原始标准测试图像 的 ‘‘Mandrill’’被称为轮廓效果,以及左下角的量化噪声太多。在图11和图12中示出了类似于图10的两个这样的示例。这说明了我们的抖动方案如何通过交易信号与量化噪声比来在这种3D信号上起作用,以使该噪声在信号的频谱上更平滑地分布。算法的这种行为并不特定于自我可视化3D信号的真彩色数字图像,但也符合一般的多维信号。5. 实验和评估为了深入了解它的实际行为,我们应用了 图 1 所 示 的抖动方案。 9以上为A图15通过LBG和我们的基于Soft-VQ的抖动(m=2.5)(左上角),然后通过Doporq(右上角),由8色调色板表示的心轴图像。Peppers图像由16色调色板表示,通过LBG和我们的基于Soft-VQ的抖动,m=2.5(左下角),然后通过Quarterorq(右下角)。表1我们的颜色编码的图像质量的平均意见得分(MOS)与Coriorq相比。原始MOS的平均值标准试验的平均MOS标准的测试图像图像编码通过Questorq4.89从54.47从5标准品的平均MOS通过LBG向量聚类和软VQ编码的测试图像3.98从5214米Attia等人包含数十张各种照片的目录。对于每张照片;我们存档了真彩色照片,一张通过硬VQ用16色调色板编码,三张通过软VQ用16色调色板编码,me {2,3,4}。[10]此档案可从http://www.rdi-e.g.com/downloads/Color-Reduction-Project_2012.rar下载。每个处理过的图像都确认了我们的抖动算法的行为,如上一节结尾所述。我们还根据经验发现,对于86L6 16,通过软VQ获得的最视觉上可接受的图像编码是在me [2.5,2.8]。11下面给出的实验结果仅意味着测量我们的抖动方案在分散真彩色图像的3D信号的量化噪声方面有多成功,该量化噪声被人类观察者感知为减轻轮廓效应。为了将这种测量放在一个重要的尺度上,我们将人类对通过我们的方案获得的图像的判断与原始真彩色图像和由Coreorq处理的相同图像进行比较(Ketterer等人,1998年),这是一个最终的算法表示真彩色图像与有限的调色板。对于彩色图像,Corneorq远远超出了信号抖动,因为它通过在调色板颜色的选择和同时将每个像素分配给这些颜色之一时正式解决组合成本最小化问题来产生最佳的色彩减少图像。显然,这种复杂的优化在计算上是昂贵的。因此,即使以我们的方式处理的图像实现了可比较的平均意见分数(MOS),这也将是一个相当大的视觉指示,表明我们的多维信号抖动在减轻轮廓效应方面非常成功;即,在3D频域中分散窄带周围的集中噪声,人类观众不会发现其输出与相当复杂的技术(如照顾彩色图像的许多其他方面的Allogorq)因此,我们选择了五个最著名的基准图像,用于评估图像处理算法,以将我们的真彩色图像抖动与EQUORQ进行比较。虽然图图13和图14显示了这五幅图像中两幅的真彩色版本,图15显示了m = 2.5时两幅图像的图像抖动和Coreorq的减少颜色输出。我们要求13名志愿者独立判断5个输入基准图像中每一个的两种算法输出的视觉质量,{非常差=1,差=2,可通过=3,良好=4,优秀=5}。平均结果见表1。表中所示的结果表明,EQUORQ产生的视觉质量更好10这个档案中很少有照片是用L=8编码的11对于大型调色板(例如L=256;根据等式,应使用更高的幂来保持合理的rmax。号(22).用我们的方法生产的;然而,我们也应该考虑到,我们的算法在数学上更容易理解和实现,而且似乎在计算上也不那么复杂。[12]必须重申的是,所提出的多维抖动方案的范围比我们用作易于可视化的应用实例的颜色减少问题更广泛和更深刻,并且这种抖动方案对其他重要领域的好处,如通信,控制,机器学习...... 等等都很棒。6. 结论本文首先对一维信号的模数(A-to-D)转换中的抖动及其对数字化信号感知质量的好处进行了快速正式回顾。然后,我们确定了将应用于一维信号的简单抖动方案推广到多维信号的困难。本文的主要贡献是介绍了一种通用的、能处理任意维数、任意数量和分布的量化质心的多维信号抖动的简洁方案,并具有可计算和可控制的噪声功率。为了可视化我们提出的多维抖动方案的动态行为,本文然后介绍了一个视觉上可感知的应用该方案的实例,通过将其投影到对真彩色图像的3D信号进行编码的问题上,以便在有限颜色集的显示器上进行最佳观看-在最小视觉失真的意义上。我们正式回顾并按时间顺序调查了解决此问题的重要方法的历史以及每种方法的优缺点。然后,抖动方案被实例化用于这个特定的3D信号处理问题,并被纳入我们这个问题的新解决方案的架构中。然后在各种图像上运行该解决方案,以便根据经验确定最佳操作设置。实验结果仅仅是为了测量我们的抖动方案在分散真彩色图像的3D信号的量化噪声方面有为了将这种测量放在一个重要的尺度上,我们将人类对抖动图像的判断与原始真彩色图像以及最终算法Algorithq处理的相同图像进行了[12] AZorq的发明者(Ketterer et al.,1998年)没有提供一个公式的复杂性顺序,他们的复杂算法,但是,我们估计他们的全边缘优化方法亲,在图像大小和缩减的· · ·颜色集的大小的乘积中引入了一些超线性(但次指数)的复杂度。另一方面,我们的抖动方案在该产品中趋于线性并且可以通过实现中的若干优化来进一步减小。8¼ai.拉瓜P .拉瓜ðÞB.ΣK克什蒂尔克am-3am-1j¼Jjaj!01000L-1000L·0j¼Jjaj!1ak!d!0k0m2KBkam;Ak1am-2;B18jam:8jKam-2Kam;231用于抖动多维信号的一般方案,以及编码图像215的可视实例用于用有限的调色板表示真彩色图像。因此,即使以我们的方式处理的图像实现了较少但可比较的平均意见分数(MOS),这也是一个相当大的视觉指示,表明我们的多维信号抖动在减轻轮廓效应方面非常成功它的输出和一个相当大的输出之间的差异...其中s是恰好等于1的j的这表明,我们提出的软VQ的量化噪声能量随着功率m的增大而接近硬判决VQ的量化噪声能量;然而,其分布也变得不那么平滑,并且更类似于硬判决VQ的分布。1个PL1。limam-2速率技术作为处理彩色图像的许多其他方面的处理器。林河j!0;jLj1j最小值aj!0j1μL-1 μ· 0¼1;27 μ L确认.. . 仅当q^c i0时发生 .1个PL1。limam-2¼为期12个月的研究项目(27/A.H./1432.第1432章资助萨勒曼·本·阿卜杜勒阿齐兹大学(Salman bin AbdulazizUni)www.sau.edu.sa,沙特阿拉伯王国阿尔哈杰林河8aj!1Lj1j最小值aj!1J1 公司简介1/4;2800(KSA)从2011年10月到2012年9月附录I.方程中的正幂m的整个范围(16)-对于0m 2,很明显,Eq.<<(十六).. . 这发生在dq; ci完全相同的时候。只有在这三种特殊情况下,r = 1,否则r> 1。 计算r= r max的最大值至关重要;即最坏的情况下,根据是所提出的软VQ的总量化噪声能量与常规硬VQ的为了获得rmax,(L-1)维区域内增长速度无限快于分母,ajajak; k 2 X f 1; 2;.的无穷小值. ; Lg,使得:P.Σ在那里产生最大值这是一个分析性的成就-可以通过求解以下(L-1)方程组来实现:@r=@akj8k.1NkXlim am-2j0m 2rmaxlim2Xr.¼82ak!d!0kP为了方便起见,让我们重写Eq。(16)作为:国王!08k0平方米1Lim 阿马杰Akam-2X X1年x·limNd!0天1nN 1ð30Þ1/4英寸D0.000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000002019- 04- 23然后又道:P本文所做的工作是通过1公斤L-1公斤· 1D8K2Xr¼¼1þ1þ一个 大胡子。一ambam ¼¼P林阿杰bm>2;L≥2;ND@r=@akj8k.学习过程。对于m=2,等式(16)简化BK8k-i最大转速j1jJ第1页m!1J-12L-1j2 L林河m!11þL第1页.m 2019 -01 -2000:00:00a2½0;1]:1035mmjj其中x=SizeOf(X)且0n,n<< L-X-1。m-2m·b。这一结果需要避免的时间间隔0平方米作为可能无限增长的软泉-量化噪声能量相对于硬量化噪声能量.. . 它可以简化为:0 (1/4).M8k-i:1320Akbk8k-iBkbk8k对任何机器的稳定性都是毁灭性的kam-2. m-2m-2。rjm¼2L1/4英寸PLa2;16j6L;124μ l为了让EQ。(31)要成立,所有的kBK布雷布克.k。bakj8k-i1/4ba;2/33b认为:
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 深入理解23种设计模式
- 制作与调试:声控开关电路详解
- 腾讯2008年软件开发笔试题解析
- WebService开发指南:从入门到精通
- 栈数据结构实现的密码设置算法
- 提升逻辑与英语能力:揭秘IBM笔试核心词汇及题型
- SOPC技术探索:理论与实践
- 计算图中节点介数中心性的函数
- 电子元器件详解:电阻、电容、电感与传感器
- MIT经典:统计自然语言处理基础
- CMD命令大全详解与实用指南
- 数据结构复习重点:逻辑结构与存储结构
- ACM算法必读书籍推荐:权威指南与实战解析
- Ubuntu命令行与终端:从Shell到rxvt-unicode
- 深入理解VC_MFC编程:窗口、类、消息处理与绘图
- AT89S52单片机实现的温湿度智能检测与控制系统
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功