没有合适的资源?快使用搜索试试~ 我知道了~
低复杂度H.266/VVC帧内编码模式选择算法的计算复杂度优化及性能实验研究
⃝可在www.sciencedirect.com在线获取ScienceDirectICTExpress 8(2022)83www.elsevier.com/locate/icte低复杂度的H.266/VVC帧内编码模式选择算法Ei Ei Tuna,Supavadee Aramvithb,Chang,Takao Onoyeca泰国曼谷10330朱拉隆功大学电气工程系b泰国曼谷10330朱拉隆功大学电气工程系多媒体数据分析和处理研究中心c大坂大学信息科学技术研究生院,大坂565-0871,日本接收日期:2020年11月16日;接收日期:2021年4月9日;接受日期:2021年8月11日2021年8月28日网上发售摘要最新的视频压缩标准,称为通用视频编码(H.266/VVC),在编码性能方面比其前身高效率视频编码(HEVC)高出50%。实现的结果,从几个复杂的工具,如32个扩展的角度模式帧内编码,先进的分区结构,和额外的变换选择的集成。然而,这些工具在全帧内编码配置中负面地传递VVC测试模型(VTM)的计算成本。现有的快速帧内编码算法实现了一个显着的节省计算时间与相当的率失真(RD)性能的VVC加上额外的计算复杂度。本文研究了VVC帧内模式选择的原始策略,分析了VVC帧内模式选择策略与VVC帧内模式选择策略之间的相关性。粗糙模式判决(RMD)的绝对变换差(SATD)代价和率失真优化(RDO)过程的RD代价之和。基于有用的相关性与有效的阈值公式,我们提出了一种快速帧内预测模式选择最耗时的RDO过程,通过选择一个小的候选集的基础上的SATD成本和计算的时间消耗 仅用于小候选集的帧内预测模式的RD成本,而没有显著的开销。根据实验结果,我们提出的系统可以减少高达27.38%,平均21.07%的计算复杂度的VTM版本5.0的质量下降不明显。c2021韩国通信和信息科学研究所(KICS)。出版社:Elsevier B.V.这是一个开放的访问CC BY-NC-ND许可证下的文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。关键词:通用视频编码;帧内编码;粗糙模式选择;最大可能模式;率失真优化1. 介绍随着包括5G在内的先进通信技术以及360度、虚拟现实(VR)和超高清(UHD)视频等逼真视频的快速启动,自过去几年以来,不同消费者对特定用途的视频需求呈指数级增长为了有效地提高编码技术对当前真实视频需求的兼容性,联合视频开发小组(JVET)已经开始了发布最新视频编码标准的第一步,称为通用视频编码该研究项目由泰国朱拉隆功大学第二世纪基金(C2F)支持。∗ 通讯作者。电子邮件地址:student.chula.ac.th(E.E.Tun),supavadee.chula.ac.th(S.Aramvith),onoye@ist.osaka-u.ac.jp(T.Onoye)。同行评审由韩国通信和信息科学研究所(KICS)负责https://doi.org/10.1016/j.icte.2021.08.018(H.266/VVC),在探索和采用了几种先进的编码工具之后[1]。VVC带来了卓越的编码效率,并提供了逼真的视频体验,加上其前身(称为高效视频编码(HEVC)[2])最远的特别是在全帧内配置下,VVC测试模型(VTM)的计算复杂度是HEVC测试模型(HM)的18倍。 VVC的这种日益增加的复杂性会导致能量有限的嵌入式系统和移动设备的能量消耗的危险,在实时环境中进行其部署是相当困难的。因此,这种高能耗给VVC带来了在编码效率和计算成本之间进行平衡的挑战。因此,节省计算复杂性以及高质量的视频体验是大多数研究人员正在努力解决的关键研究兴趣。目前,一些研究人员已经实施并发布了...提出了基于统计的快速编码技术,2405-9595/2021韩国通信和信息科学研究所(KICS)。出版社:Elsevier B.V.这是一个开放的访问CC BY-NC-ND许可证下的文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。E.E. Tun,S.Aramvith和T.奥诺耶ICT Express 8(2022)8384××× × ××+以及学习方法以节省HEVC的计算负担。对于HEVC帧内编码,帧内模式的可能数量是35,这是相当大的,并且当需要检查每个单个模式的速率失真(RD)成本时消耗编码时间。因此,大多数研究工作试图减少候选模式,即通过统计分析原始HM的性质来快速确定帧内模式,并在RD优化(RDO)检查之前收集信息以跳过不必要的帧内候选模式。在[3]中,帧内模式决策被有效地分为三个主要步骤,即粗糙模式决策(RMD)、最可能模式(MPM)和RDO。RMD算法基于Hadamard变换(HAD)计算每个可能模式的粗略RD代价,称为绝对变换差和(SATD)代价,并建立包含N个HAD代价最小的模式的候选集。利用相邻预测单元(PU)的高空间校正的优点,从相邻PU提取包括M个最佳帧内预测模式的MPM最后,最终候选列表将导致最终RDO过程,以选择具有最小RDO成本的最佳帧内预测模式由于3步帧内模式选择,候选列表中的总可能模式从原始的35个模式显著减少到3个模式。然而,RMD仍然需要计算35种模式的HAD成本,并且仍然存在可减少的帧内模式,以额外地节省针对所有可能的编码单元(CU)大小的耗尽的帧内模式选择的计算复杂度。因此,Jiang等人[4]提出了一种基于梯度的帧内模式决策,首先计算当前PU的每个像素的梯度方向,然后根据其总梯度幅度对所有可用模式进行排序。最后,取决于不同PU的大小,选择具有最大值的不同数目的候选预测模式以获得比原始HM更小的用于RMD和RDO的候选模式列表。Silva等人[5]通过执行主导边缘计算来减少需要针对特定PU大小(例如,4 4、8 8、16 16和32 32)计算HAD成本的模式的数目,因为帧内模式的数目分别显著地大到约17、34、34和34。然后,帧内候选模式的数量为44和8在执行前,8个PU从8个模式合理变更为5个模式 全面的研发搜索在[6]中,Jamali等人通过为检测到的边缘的3个相邻模式分配权重值,进一步改进了基于边缘检测的早期方法。作为DC和平面模式是最可能的帧内模式,这两种模式被合理地添加到候选列表中。为了有效地利用相邻PU之间的空间相关性最后介绍了基于SATD的二值分类器和RDO匀化算法。除了利用诸如边缘检测和梯度计算之类的额外处理的先前方法之外,Wang等人[7]统计分析相邻CU的参考样本以自适应地在3个预定义的候选集合中选择用于帧内预测的最佳候选集合。在[8]中,计算利用纹理特征与水平梯度和垂直梯度之间的高度相关性,通过定义四个经验阈值,从8个组中选择最佳候选组进行RMD。所有上述方法都可以有效地减少一定量的编码时间。然而,对于诸如边缘检测和梯度计算之类的额外处理,存在一些额外的开销,以获得用于从候选列表中跳过不必要的帧内模式的随着数据科学的发展,存在几种类型的研究以基于在线/离线学习方法(诸如机器学习(ML)[9,10]和深度学习(DL)[11,12])来减少HEVC的计算负担。虽然学习方法可以节省一定的时间,但它们高度依赖于用户定义的特征和组织良好的训练数据集。对于低复杂度的视频编码,只有一些训练数据集可用于学术目的,并且大多数都不是公开的。此外,在线学习方法需要一定量的额外开销用于训练过程。因此,具有私有数据库的昂贵学习方法对于在低复杂度视频编码中有效利用具有较小的关注。与H.265/HEVC的计算成本相比,VVC通过将帧内预测模式从35增加到67来准确地预测当前CU和3个额外的MPM,实现了更好的帧内编码的编码效率。 根据对于扩展的角模式,VVC适应了一些变化,在HEVC的3步帧内模式决策中。在[13]中,RMD过程分为两个阶段:1)第一轮SATD对于原始角模式; 2)对于扩展角模式的第二轮SATD。对于第一轮,首先计算包括DC、平面和32个偶角预测模式的35个模式的SATD成本。然后,第一轮选择具有最小SATD成本的最佳N个预测模式的候选列表,其中N取决于当前CU的宽度和高度。第二轮仅计算大于3且小于66的每个父模式的两个相邻模式的SATD成本。因此,计算SATD成本的模式总数可以从67减少到最多(35 2N)。然后,候选人 包括具有最小SATD成本的N个帧内模式的列表在RMD过程中,被选为RMD模式。在RMD过程之后,M个MPM与RMD模式合并以获得用于RDO过程的最终候选列表。此外,VTM启动用于变换编码的多变换选择(MTS),以引入两个新的附加变换,称为离散余弦变换类型7(DCT 7)和离散正弦变换类型8(DST8),因为HEVC采用DCT类型2(DCT 2)的变换编码。因此,RDO过程需要计算用于帧内模式中的所有帧内模式的RD成本。具有用于水平和垂直方向的5个不同变换组合(例如,(DCT 2,DCT 2)、(DST 7,DST7)、(DCT 8,DST 7)、(DST 7,DCT 8)和(DCT8,DCT 8)。具有MTS的扩展角模式可以以极端的计算复杂度实现非凡的编码效率此外,VCC为CU分区引入了四叉树加上二叉树和三叉树结构,如图所示。1.一、E.E. Tun,S.Aramvith和T.奥诺耶ICT Express 8(2022)8385图1.一、V V C 的一种可能的四叉树加多叉树(QTMT)分区结构。根据扩展角度模式和高级CU分割结构,VVC遭受帧内编码的极端计算复杂性,因为CU分割结构的可能数量和CU的数量逐渐增加,并且这些增加的CU需要遍历所有可能的帧内预测模式以比较每个模式的RD性能。因此,用于VVC的低复杂度帧内模式决策最近成为用于功率受限设备的视频应用的复杂度控制视频编码中的热门话题。在[14]中,提出了用于RMD过程的基于梯度下降的帧内模式决策。最初,搜索当前CU的所有MPM的Hadamard成本,并从中选择具有最小Hadamard成本的最佳MPM作为初始搜索模式。然后,基于可变步长的双向梯度下降搜索的方式来找到候选模式列表的RMD过程。Zhang等人。[15]根据方向将所有角度模式分为四组(0度,45度,90度和135度角),并利用Canny算子计算当前CU的每个像素的梯度值。然后,通过投影梯度向量计算每个组的能量,并按降序排序。最后,选择主要和/或次要组,并且仅计算与这些选择的组对应的角模式的SATD成本,而不是计算所有35个角模式在第一轮的RMD过程。因此,这种方法可以减少最多50%的计算复杂度的第一轮在RMD阶段。所有上述方法都可以通过引入额外的计算开销来降低VVC的计算复杂度,该额外的计算开销对于仅每个CU和每个帧内模式来说可以是小的。然而,每个编码树单元(coding tree unit,CTU)的CU和帧内模式的数量分别根据诸如CTU分割结构和VVC的扩展角度模式的高级特征而对于每个CTU,存在30,805个帧内预测和用于每个帧内预测的67个帧内预测模式。总共,需要选择具有最佳帧内预测模式的最佳CTU分区的帧内预测的数量为2,063,935。因此,总体计算开销可以减少用于VVC的快速帧内编码算法的时间节省。为了提供额外开销如何影响VVC的整体计算复杂度的重要观察,利用快速帧内模式决策部分[14]的一些实验结果,并且合理地计算每个分辨率的平均编码时间节省(ETS),如表1所示。从表1中可以看出,根据分辨率,快速接近的每个分辨率的平均ETS可以减小。 详细地,具有600帧的低分辨率BQSquare和具有300帧的高分辨率FoodMarket4的ETS值是最高的(32.87%)和最低的(14.01E.E. Tun,S.Aramvith和T.奥诺耶ICT Express 8(2022)8386××× × ××我的天+表1对参考快速进近的观察[14]。分辨率序列ETS(%)平均ETS(%)4096 2160探戈2 14.3714.19食品市场4 14.01猫机器人1 24.61表2对视频序列进行统计分析。帧速率A 2560 1600 交通3030号大街上的人BQ露台3840× 21601920× 1080832× 480416× 2401280× 720营火26.5DaylightRoad2 27.88ParkRunning3 18.51篮球驱动器23.81BQ露台28.98仙人掌28.05和服18.7ParkScene 27.45篮球训练25.18BQ商城28.03聚会场景30.81赛马29.12BasketballDrillText 25.15篮球通行证25.05BlowingBubbles 30.6BQSquare 32.87赛马29.35四个人25.59约翰尼22.6KristenAndSara 24.56幻灯片编辑28.6幻灯片放映25.1224.3825.427.6629.4725.29和服BasketballDrillTextBQMall赛马吹泡泡额外的处理时间。在这项工作中,我们的目标是探索快速帧内编码的研究漏洞,并找到一个简化的解决方案相比,现有的。为此,我们研究了VVC帧内模式决策的性质,并收集有用的信息,以统计方式选择最佳的帧内模式。2.1. 粗糙模式决策首先,我们研究了在RMD过程中的帧内模式的SATD成本,包括原始的35个帧内模式加上候选模式的相邻模式,并观察在RMD过程之后候选模式之间相似的SATD成本的发生。每个帧内预测模式的SATD成本搜索分别为4800(42600)和163200(3217300)。因此,使用附加和高级技术(例如,梯度下降搜索)可影响高分辨率视频序列的总编码时间,这是由于需要利用此类技术的在本文中,我们研究了原始VVC帧内编码的性质,并提出了一个简化的帧内模式决定的分析信息的基础上,而不引入显着的额外开销。本文首先利用多个视频测试序列对帧内预测模式在第一轮和第二轮的SATD代价进行了统计分析。从统计数据中,我们观察到,在RMD过程的候选模式列表中存在若干帧内预测模式,这些模式是重要的,并且根据它们的SATD成本,它们很有可能成为最终的最佳模式。然后,在RDO过程之前,合理地利用RMD过程的SATD代价代替RDO过程的真实RD代价,并为每个CU计算一个有效可变的阈值来选择RDO过程的有效模式。最后,我们有效地通过只有重要的模式RDO过程中搜索昂贵的全RD成本与几个MTS组合。VTM 5.0内置了上述策略,n通过采用Eq. (1):SATDn=DHAD+λ×Bitn( 1)其中D_H_AD为基于当前CU的Hadamard变换的恒定失真,位n为模式n所需的位数目,且λ为拉格朗日乘数。从通过观察,我们发现RMD过程的候选模式可以分为两组:具有相似SATD成本的模式,即,共同模式和不同模式,即,模式,分别。接下来,我们研究RDO过程的最终最佳模式和显著模式之间的统计相关性。为了这项调查,我们在VTM 5.0上进行了几次实验,使用了来自五个视频类别(A到E)的10个视频序列,这些视频序列具有不同的分辨率,帧速率和主题,如表2所示。我们有目的地选择这些视频序列,以涵盖所有类型的视频场景,如局部和全局运动,高和低运动,丰富和较少的纹理,以及大和小的背景区域。为了分离RMD过程的候选模式列表中的重要模式和共同模式,通过使用等式(1)搜索每个CU的分隔符索引(二):VVC帧内模式决策的复杂性,在可比质量下的编码时间节省方面优于VTM 5.0。索引n,i f S AT Dn=S AT Dn+1空,否则(二)2. VVC帧内模式判决的统计分析如前所述,现有的研究集中在使用先进的技术用于快速帧内编码算法60B 1920× 10802450C 832× 4806030D 416× 24050Vidyo160E 1280× 720Johnny60E.E. Tun,S.Aramvith和T.奥诺耶ICT Express 8(2022)8387其中,S AT D n和S AT D n+1是模式n和n的两个连续SATD成本1所示。候选模式列表根据候选模式的SATD成本以升序排序,并且n是模式索引,E.E. Tun,S.Aramvith和T.奥诺耶ICT Express 8(2022)8388−+图二. 最佳模式的显著模式百分比 一帧。平均百分比为99.8%。从1到N1,其中N是候选模式的数量在RMD过程中。一旦发现n和n+1的成本相同,则将众数索引n表示为分隔符索引,并且终止索引的检查过程。在分隔符索引之前的候选模式被定义为有效模式,并且剩余的模式是公共模式。在通过使用指数分离显著模式和共同模式之后,通过将每个显著模式与基础真实最终最佳模式进行比较来计算成为最终最佳模式的显著模式的百分比图2示出了根据实验结果,对于一个测试的视频序列,作为最终最佳模式的显著模式的百分比,并且对于所有测试的视频序列,帧的平均百分比大于99.7%。因此,可以观察到,与共模相比,有效模式具有2.2. 率失真优化由于VVC帧内编码中的若干CU分区结构和帧内预测模式,RDO是极其耗时的过程。为了得到最佳的CU分区结构和帧内预测模式,VVC需要通过计算每个可能组合的RDO成本并相互比较来遍历所有分区结构和预测模式。因此,如果我们可以仅计算具有成为最终最佳模式的高可能性的重要帧内模式的RDO成本并且跳过其他常见帧内预测模式的RDO成本,则是有效的。因此,分析(3)RMD工艺的SATD成本和RDO工艺的全部RD成本之间的相关性相当高,这是由于它们用于计算成本的类似结构基于先前的统计和观察,我们的研究动机是通过将所有可能的候选模式分组成两个组(显著组和共同组)并仅计算显著组的候选模式的全RD成本来降低RDO过程的候选帧内预测模式。为了有效地对RDO过程的所有可能的候选模式进行分组,根据它们的高相关性,RMD过程的SATD成本被有效地利用,而不是RDO过程的昂贵的RD成本。另一个重要的事实,为什么我们专注于减少候选模式的RDO过程是RDO是最昂贵的部分,约85%,与RMD和MPM过程的VTM 5.0相比。3. 方法在本文中,我们首先利用这一有效的观察作为我们的主要贡献,分离的候选模式的充分RDO分为两组:显着和共同模式的基础上的SATD成本的候选模式。3.1. RDO过程图3示出了具有所提出的显著帧内模式选择的VVC的原始帧内模式预测的流程图,其以蓝色阴影表示帧内模式选择有三个原始部分和所提出的想法的一个附加部分。为了在RDO过程中使用RMD过程的SATD成本在原始的第一和第二轮RMD和MPM过程之后,在计算最终候选列表的昂贵RD成本之前,有效地利用来自RMD过程的SATD成本来从RDO过程的最终候选列表中选择重要模式。在选择之前,最终候选列表中的候选模式根据其SATD成本以升序排序。在第2.1节中,我们分析了一些统计数据,利用相同SATD成本值的指标值来区分显著模式和共同模式。这里,为了实现比使用相同索引更高的时间节省,我们用公式表示可变阈值来找到显著模式和共同模式之间的间隔指数。3.2. 可变阈值候选模式的全部RD成本,因为RDO过程是最昂贵的部分,与VTM 5.0的RMD和MPM过程相比约为85%[16]。候选模式n的全部RD成本通过使用等式(1)来计算(3):RDn=DSSE+λ×位n(3)其中DSSE是基于平方误差之和(SSE)的失真,比特n是模式n所需的比特量,λ是拉格朗日乘数。类似于RDO过程情况,存在具有与其它候选模式类似的全RD成本的若干RDO模式从Eq可以看出(一)为了选择阈值,我们首先计算模式n和n的每两个连续SATD代价的绝对差值abs DF Fn1、使用Eq。(4)、然后,我们选择具有最低差值minT H的可变阈值,如等式(1)所示。(五)、最后,有效地搜索基于每个CU的最小可变阈值IndexTH的索引,并使用该索引来使用等式(1)来决定RDO过程的最终候选列表中的每个帧内预测模式是否有效。(六)、绝对DF F n= |S AT D n− S AT D n+1|(四)E.E. Tun,S.Aramvith和T.奥诺耶ICT Express 8(2022)8389我的天=×表3测试JCT-VC的视频序列仙人掌派对场景DBlowingBubbles图3.第三章。拟 议 方案的流程图。minTH = min(abs DF F0,abs DF F1,. . . ,abs DF Fn−1)(5)Ubuntu 16.04 LTS所有实验均在所有Intra(AI)配置下使用四个QP(27、22、17和12)执行,测试视频的完整描述见表3,来自JVET的通用测试条件(CTC)源[17]。4.2. 性能度量为了有效地测量所提出的系统与原始VTM 5.0的性能,最有趣的度量称为编码时间节省(ETS)是通过利用等式测量。(七):ETSETVTM−ET100%( 7)TM其中ETVTM和ETProposed是VTM5.0和所提出的算法。此外,为了分析快速编码算法的编码 性 能 和 编 码 时 间 节 省 之 间 的 权 衡 , 我 们 计 算 了Bjontegaard Delta比特率(BD-BR)和峰值信噪比(BD-PSNR)[18]的值,用于测量客观视频质量。4.3. 业绩评价和讨论4.3.1. 整体编码时间节省和客观测量在这一小节中,原始VTM和我们提出的RDO过程的重要模式选择的性能比较。表4描述了VTM 5.0和拟定方法的评价结果。 可以看出,我们提出的系统优于,I ndexTHn,i f abs DF Fn<=minT Hnull,否则(六)在码率增量较小的情况下,仅占总码率的0.88%,有效地降低了VVC的计算复杂度比特率和可忽略的质量下降,0.06平均dB。节省的最小和最大时间4. 实验结果与讨论4.1. 模拟数据和配置对于所提出的方法的性能测量和分析,所有实验结果都是通过在具有Intel(R)Core(TM)i7-6700 CPU@3.40GHz× 8处理器,8 GB RAM,BlowingBubbles和BQMall分别为18.43%和27.38%,分别小于和大于平均值2.6%和6.3%。4.3.2. 仅为RDO过程和额外开销为了证明计算复杂度降低的有效性,我们选择了两个具有代表性的视频序列,类决议序列帧率一2560× 1600街上的人15030和服B 1920× 1080240500245060060QQ咨询C 832× 4805005050050416× 240BQSquare60060FourPeople60060E1280× 720克里斯汀和萨拉约翰尼6006006060E.E. Tun,S.Aramvith和T.奥诺耶ICT Express 8(2022)8390表4所提出的方法在VTM 5.0上的性能序列BD-BR(%)BD-PSNR(dB)ETS(%)街上的人+0.85-0.0619.88和服仙人掌+0.76+0.59−0.03-0.0420.2721.36BQ商城+1.22 −0.08 27.38派对场景+0.78 −0.09 19.47吹泡泡+0.76 −0.09 18.43BQ平方+0.91 −0.11 19.88四人+0.99 −0.05 21.57克里斯汀和萨拉+0.94 −0.04 21.12约翰尼+1.00 −0.04 21.39平均值+0.88-0.06 21. 07表5仅为RDO过程节省编码时间QP吹出气泡的ETS(%)BQMall的ETS(%)2742.2543.392242.9545.551743.9646.281244.5946.52平均43.4445.43不同的主题和分辨率,命名为BlowingBubbles和BQMall,并测量仅用于RDO过程的ETS。表5显示,我们可以减少43.44%和45.43%的编码时间在RDO过程中的VTM 5.0平均与一个微不足道的质量损失吹泡泡和BQMall,分别。总之,RDO过程的ETS值对于所有QP都是稳定的,并且平均时间节省在VTM 5.0上是显著的。由于RDO过程的这种显著ETS,所提出的系统在VTM 5.0的整个编码过程中实现了合理的ETS,因为RDO过程与整个编码过程的ETS成正比。详细地,BQMall的ETS大于BlowingBubbles,因为BQMall的RDO过程的ETS大于BlowingBubbles。此外,如我们从图3中可以看到的,由于利用更简单的解决方案的有趣的研究和观察,与先前的方法相比,重要的帧内模式选择部分并不复杂。因此,我们提出的系统的额外开销不超过总编码时间的0.8%,这是非常合理的,适用于实时环境。5. 结论由于对统计分析的有效观察和对可变阈值的适当制定,所提出的系统可以从RDO过程的最终候选列表因此,RDO过程需要仅针对重要模式而不是所有候选模式计算耗时的全部RDO成本。此外,由于显著模式选择的简单额外步骤,所提出的系统实现了合适的编码节省了时间,同时具有合理的质量损失,而不引入任何显著的开销。CRediT作者贡献声明Ei Ei Tun : 概 念化 ,数 据管 理, 形式 分析 ,写 作Supavadee Aramvith:概念化,形式分析,写作小野孝夫:写作竞合利益作者声明,他们没有已知的可能影响本文所报告工作引用[1] B. Bross,Versatile video coding(draft 1).文件:JVET-j1001,in:Joint Video Experts Team(JVET)of ITU-T SG 16 WP 3 andISO/IECJTC 1/SC 29/WG,11,2018.[2] G.J.Sullivan,Overview of the high efficiency video coding(HEVC)standard,IEEE Trans.Circuits.视频技术22(2012)1649-1668。[3] I.金,K. McCann,K.杉本湾布罗斯,W.- J.Han,Versatilevideocoding ( draft 1 ) . 文 献 : JVET-j1001 , 在 : 高 效 率 视 频 译 码(HEVC)测试模型14(HM 14)编码器描述(High EfficiencyVideo Coding ( HEVC ) Test Model 14 ( HM 14 ) EncoderDescription),文献JCTVC-P1002,JCT-VC,2014中。[4] W. Jiang , H. 马 , Y 。 Chen , Gradient based fast mode decisionalgorithmforintrapredictioninHEVC , in : Proc.2ndInt.Conf.Consum. 电子、Commun. 网络,Apr. 2012年,第页1836-1840年。[5] 朗格da Silva,L.V. Agostini,洛杉矶da Silva Cruz,Fast HEVC intraprediction mode decision based on EDGE direction information,in:Proc. 第20集信号处理。确认,八月2012年,第页1214-1218[6] M. Jamali , S. Coulombe , F. Caron , Fast HEVC intra modedecisionbased on edge detection and SATD costs classification ,Proc.IEEE Int. 数据压缩Conf. (4月)2015)43[7] L. Wang , W. Siu , Novel adaptive algorithm for intra predictionwithcompromised modes skipping and signaling processes in HEVC,IEEETrans. 电路. 系统视频技术23(2013)1686[8] T. Zhang , M. Sun , W.G. D. Zhao , Fast intra-mode and CUsizedecision for HEVC , IEEE Trans. Circuits. 系 统 视 频 技 术 27(2017)1714-1726。[9] F. Z.P. , Z. 马 , Y 。 Wang , Fast mode and partition decisionusingmachine learning forintra-framecodingin HEVCscreencontentcoding extension,IEEE J. Emerg. Sel. Topics Circuits Syst. 6(2016)517-531.[10] L. Zhu,Y. Zhang,Z. 潘河,巴西-地Wang,S.Kwong,Z.Peng , Binaryandmulti-classlearningbasedlowcomplexityoptimization for HEVCencoding,IEEE Trans. 广播. 63(2017)547[11] X. Yu,Z.作者简介:刘杰,王玉. Gao,L. Wang,VLSI friendlyfast CU/PU mode decision for HEVC intra encoding : Leveragingconvolution neural network , in : IEEE Int. Conf. Image Process.(ICIP),2015,pp. 1285-1289.[12] T. Laude,J. Ostermann,Deep learning-based intra prediction modedecision for HEVC,IEEE Picture Coding Symp. (PCS),2016,pp.1-5.[13] 陈杰,Y. Chen,M. Karczewicz,X. Li,H.柳湖,加-地Zhang,X.赵,下一代视频编码工具研究,ITU-TSG 16 Doc. COM16CC806,2月2015年。[14] H.扬湖,澳-地Shen,X.东角,澳-地Ding,P. An,G.江,低复杂度E.E. Tun,S.Aramvith和T.奥诺耶ICT Express 8(2022)8391CTU分区结构决策和快速帧内模式决策的通用视频编码,IEEETrans.Circuits。系统视频技术(2019年第1-14期)E.E. Tun,S.Aramvith和T.奥诺耶ICT Express 8(2022)8392[15] Q. Zhang, Y.王湖,加-地 黄湾,澳-地 Jiang,Fast CU partitionandintra mode decision method for H.266/VVC , IEEE Access 8(2020)117539-117550。[16] F. Bosse,VVC测试模型VTM参考软件5.0,2020,https://vcgit. 海喜岛fraunhoferr. de/jvet/VVCSoftware_VTM/-/tre/VTM-5. 0/的。[17] K. Suhring,X. Li,JVET常见测试条件和软件参考配置。文件:JVET-b1010,在:ITU-T SG 16 WP 3和ISO/IEC JTC 1/SC 29/WG的联合视频专家组(JVET) 2016年11月[18] G. Bjontegaard ,计算RD曲线之间 的平均PSNR 差异。文件:VCEG-M33,ITU-T VCEG会议,2001年。
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 探索AVL树算法:以Faculdade Senac Porto Alegre实践为例
- 小学语文教学新工具:创新黑板设计解析
- Minecraft服务器管理新插件ServerForms发布
- MATLAB基因网络模型代码实现及开源分享
- 全方位技术项目源码合集:***报名系统
- Phalcon框架实战案例分析
- MATLAB与Python结合实现短期电力负荷预测的DAT300项目解析
- 市场营销教学专用查询装置设计方案
- 随身WiFi高通210 MS8909设备的Root引导文件破解攻略
- 实现服务器端级联:modella与leveldb适配器的应用
- Oracle Linux安装必备依赖包清单与步骤
- Shyer项目:寻找喜欢的聊天伙伴
- MEAN堆栈入门项目: postings-app
- 在线WPS办公功能全接触及应用示例
- 新型带储订盒订书机设计文档
- VB多媒体教学演示系统源代码及技术项目资源大全
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功