基于分层B帧的多视点视频编码快速运动与视差估计算法

需积分: 16 2 浏览量更新于2024-08-12 收藏 445KB PDF 举报

本文主要探讨了多视点视频编码中的一种高效运动和视差估计快速算法，发表于2011年的《北京工业大学学报》第37卷第5期。针对多视点视频编码复杂度较高的问题，作者邓智珉、贾克斌、陈锐霖和伏长虹提出了一个创新的解决方案。他们的算法设计基于分层B帧的视点-时间预测结构，这一结构能够有效利用参考帧图像与当前编码图像之间的运动矢量和视差矢量的几何关系。算法的核心思想是通过设计可靠的预测矢量作为搜索的起点，这些预测矢量利用了运动矢量和视差矢量之间的关联，减少了搜索范围。在多个方向的参考帧内，进行小范围的运动补偿，这样可以更精确地找到最佳的运动和视差矢量。与传统的全搜索算法如JMVM相比，该方法显著降低了编码的复杂度，只需要一次搜索过程就能同时确定最佳的运动和视差矢量，从而节省了87.69%的编码时间。多视点视频由于包含了丰富的深度信息，对于3D电视、自由视点电视、实时可视会议和虚拟现实等领域具有巨大价值。然而，随着摄像头数量的增加，数据量的增大对传输和解码带来了挑战。为了解决这个问题，论文提出的方法旨在通过高效地利用不同视点之间的冗余信息，提高压缩效率，从而推动多视点视频编码的实用化进程。多视点视频编码标准的制定者MPEG和VCEG联合成立的JVT小组对此进行了深入研究，其开发的JMVM参考模型为多视点视频编码提供了一个研究框架。在JMVM中，分层B帧的视点-时间预测策略是关键组成部分，它能有效地整合同一视点的时空信息以及跨视点的冗余，这在文中所提出的快速算法中得到了实际应用。这篇文章是一项针对多视点视频编码复杂度的优化工作，它不仅提高了编码效率，还为后续的多视点视频编码技术发展提供了有价值的技术参考。通过这种快速的运动和视差估计方法，多视点视频的传输和处理能力得到了显著提升，为相关领域的实际应用打下了坚实基础。

第

卷第

期

2011

年

月

北京工业大学学报

JOURNAL OF BEIJING UNIVERSITY

TECHNOLOGY

No.5

May

2011

多视点视频编码中的运动和视差估计快速算法

邓智珉

，

贾克斌陈锐霖

伏长虹

萧允治

(1.北京工业大学电子信息与控制工程学院，北京

100124;

香港理工大学电子资讯工程系，香港)

摘

要:针对多视点视频编码复杂度高的问题，提出一种基于分层

帧视点-时间预测结构的运动和视差联合

估计快速算法.利用参考帧图像和当前编码图像的运动矢量及视差矢量之间的几何关系，设计可靠的预测矢量

作为搜索起始点，并分别在不同方向的参考帧内进行小范围的运动补偿以得到最佳运动和视差矢量.该方法由

前一次运动/视差估计得到候选矢量来进行下一次视差/运动估计，只需

次搜索过程就能同时确定最佳运动和

视差矢量.实验结果表明，该算法与

JMVM

全搜索算法相比，能在保持编码质量的同时，节省

87.69%

的编码

时间.

关键词:

H.264;

多视点视频编码;视差估计;运动补偿

中图分类号:

919.81

文献标志码

文章编号:

0254 - 0037

(2011)

05 - 0683 - 08

多视点视频蕴涵了景物的深度信息，在自然场景的表征上更具真实感，在

电视、自由视点电视、具

有临场感的可视会议及虚拟现实等领域展现了广阔的应用前景

[1]

与传统的单视点视频相比，多视点视

频需要处理的数据量随着相机数目的增加而成倍增加，这给传输和解码带来了巨大的负担.因此，如何对

海量的视频数据进行高效的压缩编码成为多视点视频面临实用化的一个重要问题.最直接的多视点视频

编码方法是对各个角度的视频采用传统的

H.264/AVC

编码器进行单独编码(

Simulcast

算法)

.然而，由

于多视点视频是由多台摄像机从不同角度同时拍摄同→场景得到的，不同视点间包含大量交叉冗余信息，

因此，必须充分利用不同视点之间的交叉相关性来获取更高的压缩效率

[2]

MPEG

和

VCEG

联合成立了

JVT

小组，专门讨论制定了多视点视频编码标准[町，将其作为

H.264

的一个增强部分.基于

H.264

标准，

JVT

还开发了一套参考模型

JMVM[4]

为多视点视频编码提供了研究平台.在

JMVM

中，基于分层

帧的

视点-时间预测结构充分利用同一视点内部空间、时间和相邻视点间的交叉冗余信息，采用运动补偿预

测、视差补偿预测技术，对多视点视频数据进行有效的存储和传输[

许多学者

[ι11]

利用多视点视频的序列相关性提出了新的编码算法.文献

[6J

结合立体视频左右视点

不同宏块模式之间的相关性，提出了一种应用于立体视频编码中的视差估计快速算法，有效降低了视差估

计的复杂度

;San

等

[7]

结合摄像机发射和极线的几何学特性提出了一种快速视差估计算法

;Kim

等问]提出

→种自适应搜索窗口的快速运动和视差估计算法，通过设定

个阔值来衡量预测矢量的可靠性，进而控制

搜索窗口的大小

;Li

等

[9]

提出一种帧间编码快速算法，由相邻视点的参考帧来确定当前编码块的预测类

型，去除视点方向的一些无用搜索区域，并且在此基础上设计一种模式选择快速算法，但文中没有给出具

体的理论分析，更没有充分利用运动矢量和视差矢量的关系

;Guo

等口。]采用全局视差来表征相邻视点间

的联系，在解码端只需直接复制相邻视点对应块的信息来得到当前编码块的运动矢量，能在一定程度上节

省码率，但是全局视差矢量的计算增加了运算复杂度;

Ding

等川提出一种模式选择算法提前终止不必要

的模式遍历，但是该编码结构为立体视频编码结构的简单扩展，不能满足多视点视频的编码需求;另外，该

算法通过视差估计的结果来降低运动估计的复杂度，但是运动估计和视差估计相对独立，视差估计仍采用

穷尽的全搜索算法，编码效率还需提高.鉴于此，本文提出一种高效的运动和视差联合估计快速算法，在

收稿日期:

2009-04-17.

基金项目:国家自然科学基金资助项目(

30970780)

;北京市自然科学基金及教委重点科技项目(

KZ200910005005 ) .

作者简介:邓智政

(1983

一)

，女，湖南邵阳人，博士研究生.

下载后可阅读完整内容，剩余7页未读，立即下载

weixin_38748555

粉丝: 6
资源: 933

基于分层B帧的多视点视频编码快速运动与视差估计算法

多视点视频编码中的视频目标提取与视差匹配.pdf

基于多视点视频编码的差错控制算法

低复杂度多视点视频编码的有效运动和视差估计优化

一种基于H.264的立体视频编码中的视差估计快速算法 (2006年)

基于相邻宏块参考方向的运动和视差估计快速算法

降低计算复杂度的多视点视频编码运动与视差估计优化

基于矢量估计和加权视差插值的多视点视频编码

应用于多视点视频编码的基于深度特征的图像区域分割与区域视差估计

视差运动估计的几种算法

分布式多视点视频编码中边信息生成的研究.pdf

最新资源