MPEG-4视频编码技术在ADSP-BF561 DSP上的实现与优化

66 浏览量更新于2024-06-24 收藏 1.09MB DOC 举报

"MPEG-4视频编程技术研究主要探讨了如何在ADSP-BF561 DSP上实现MPEG-4视频编码的实时处理。该文深入解析了MPEG-4编码技术，包括其对象编码思想，高压缩比，可扩展性和可交互性的特性。在选择ADI公司Blackfin系列的DSP作为平台的基础上，文章详细阐述了选用BF561的原因，主要是因为其在图像处理性能和成本效益方面的优势。 MPEG-4编码技术的核心包括DCT（离散余弦变换）和运动估计。文中对这两种核心算法进行了优化研究，提出了基于起点预测的改进菱形运动估计算法，以提升运动向量预测的精度。此外，考虑到BF561的双核结构，设计了一种宏块层并行算法，以充分利用处理器的计算能力。在实现方面，论文详细介绍了MPEG-4简单框架编码器的软件实现方案，包括在VC++环境中用C语言实现的视频压缩功能。同时，针对硬件平台的特性，对存储器配置、DMA（直接存储器访问）控制和代码进行了优化，确保编码器能在BF561上实现CIF（Common Intermediate Format）格式30帧/秒的编码速度，达到预期的性能目标。在绪论部分，论文强调了视频编码在信息化社会中的重要性，尤其是在数字化视频信息的存储和传输中的挑战。从电影和电视的发展到数字技术的应用，视频信号的处理始终伴随着数据量巨大的问题。通过视频编码技术，可以有效解决这一问题，使得高清视频能在有限的带宽和存储空间下得以传播和利用。这篇学士学位论文深入研究了MPEG-4视频编码技术，不仅理论分析了其关键技术，还通过实验证明了在特定硬件平台上实现高效编码的可行性。这为未来在嵌入式系统中应用MPEG-4编码提供了重要的参考和实践指导。"

AV(Audio Video)In]x,-t 象是 MPEG．4 为支持基于内容编码而提出的重要概

念。对象是指在一个场景中能够访问和操纵的实体，对象的划分可根据其独特的

纹理、运动、形状、模型和高层语义为依据。在 MPEG-4 中所见的视音频己不

再是过去 MPEG-l、MPEG．2 中图像帧的概念，而是一个个视听场景(AV 场景)，

这些不同的 AV 场景由不同的 AV 对象组成。AV 对象是听觉、视觉、或者视听

内容的表示单元，其基本单位是原始 AV 对象，它可以是自然的或合成的声音、

图像。原始 AV 对象具有高效编码、高效存储与传输以及可交互操作的特性，它

又可进一步组成复合 AV 对象。因此 MPEG．4 标准的基本内容就是对 AV 对象

进行高效编码、组织、存储与传输。AV 对象的提出，使多媒体通信具有高度交

互及高效编码的能力，AV 对象编码就是 MPEG-4 的核心编码技术。

MPEG-4 不仅可提供高压缩率，同时也可实现更好的多媒体内容互动性及全

方位的存取性，它采用开放的编码系统，可随时加入新的编码算法模块，同时也

可根据不同应用需求现场配置解码器，以支持多种多媒体应用【12】。

MPEG-4 采用了新一代视频编码技术，它在视频编码发展史上第一次把编码

对象从图像帧拓展到具有实际意义的任意形状视频对象[13】，从而实现了从基于

像素的传统编码向基于对象和内容的现代编码的转变，因而引领着新一代智能图

像编码的发展潮流。

2．1．3 MPEG．4 的框架及应用场合

MPEG．4 的应用领域非常广泛，即可以用于高质量的数字电视，也可以用

于极低码率的无线多媒体通信，还可以进行交互式处理，为了适应各种应用对编

码特性的需求，同时满足编码结构的清晰，MPEG-4 设计了各种层次的框架

(Profile)结构【¨】，以适应于不同领域的编码需求。每一个框架下定义了多个级

(Level)，用于限制计算的复杂度，也适应于不同编码领域的细分要求，具有很大

的灵活性。MPEG．4 中的 Profile@Level 组合形式，其作用是：允许编码器的厂

家仅仅实现标准的子集，加上上级子集对下级子集的全兼容，这样可以最大限度

的实现与其他 MPEG-4 设备的互通。

由于 MPEG-4 是一个完整的多媒体应用框架【l 51，设计的范围非常广泛，

视频编码仅仅是其中的一部分，而且涉及到编码部分就包含自然景物、三维图像

等领域。结合目前图像分割技术的不完善，本文仅仅研究基于矩形编码类的框架。

所以，考虑表 2．1 所列三类编码框架。

本课题研究的 CIF 格式实时 MPEG．4 编码系统，因为高级简单框架涉及

B．VOP 编码，具有后向预测部分，需要根据视频对象平面组层的排列，存储多

帧数据，不利于实时处型 16】。对比而言，简单编码框架(Simple Profile)，虽然

在编码的压缩率方面存在一定的损失，针对本课题实时编码的研究，压缩率上的

损失是可以接受，并因其编码的复杂度最低，具有很好的成本控制能力，所以本

课题选用该框架结构。

2．1．4 MPEG．4 SP 框架的关键技术分析

MPEG-4 是 MPEG 系列的最新发展，其借鉴了其他视频标准的优秀算法，

并在其基础上进行了一系列的改进。本章节重点介绍课题应用的 SP 框架关键的

技术，为后续章节的论述，打下基础。

1．I-VOP／P-VOP

MPEG-4 编码的基本单元是 VOP(Video Object Plane)，相对于以前编码标准

中“帧’’的概念。

I-VOP：帧内 VOP，称为 I 帧。I-VOP 是独立压缩编码的，不需要其他 VOP

作为参考。是后续的 P-VOP 所需运动估计的参考点，因此，在视频码流中需要

周期性的插入 I-VOP。

P-VOP：帧间 VOP，称为 P 帧。利用前一帧编码的 I—VOP 或者 P-VOP 做

帧间预测编码。为了减少编码误差，所使用的预测参考帧不是那帧图像的原始图

像，而是该帧的重构帧。

在实际的编码中，一个视频对象组(GOV)包括一个 I—VOP 和多个 P-VOP。

开始的是 I-VOP，其与前面的 VOP 无依赖关系，可以独立编码，因此出现误码，

也不会传播到下面的 GOV，后面的是 P-VOP，其参考重构的 I—VOP 编码，提

高码流压缩率。

2．运动估计补偿技术

运动估计补偿技术 n71 其主要目的是除去视频序列的时域相关性，其基本的

原理这里不进行叙述。运动估计补偿模块是编码标准的关键算法：其很大程度上

决定编码的效率。好的运动估计算法可以快速确定匹配的运动估计向量，大大减

少计算量，提高编码速率。据估计，运动估计算法占到编码计算量约 60％，对

编码速度的影响很大。

目前，MPEG-4 编码验证模型采用的运动估计算法是钻石搜索法，又叫菱形

搜索法。本课题对其进行了细致的研究，并进行了较大的改进，详细论述见章节

3．2。

下面主要介绍 MPEG 一 4 SP 框架区别于以前编码标准的一些特点：

(1)1／2 或者 1／4 像素精度估计

考虑到前后两帧的物体运动不一定是整数像素，为提供运动估计的精度，需

要在 1／2 或者 1／4 像素位置内插一个参考帧。可以提高估计精度，但增大了运

算开销和存储容量。

(2)无限制运动向量

无限制运动向量(UMv)¨砌通过填充技术，针对边界处的宏块，根据搜索窗

口的大小，等值扩充边界，提高搜索精度。因运动向量超出原有图像的边界，因

此称为无限制运动向量。

(3)四运动向量模式

16*16 的亮度宏块可以作为一个整体进行运动补偿 n91，或者作为 4 个 8*8

块单独进行运动补偿，即为四运动向量模式，每个 8*8 的亮度块对应于一个运动

向量，小尺度的块更适应于图像细节部分的运动估计，提高编码压缩率。

3．容错性

由于 MPEG-4 的应用范围很广，为了有效的消除错误的影响，MPEG-4 提供

了三种错误恢复工具：再同步、数据恢复和错误掩盖与刷新啪 3。

(1)再同步机制类似 MPEG-2 的 slice 层语法提供的功能。在 MPEG-4 中以视

频包作为再同步单位瞳¨，由于错误发生的随机性和码字的不均匀性，MPEG

一 4 决定使用固定比特数的视频包。如果当前视频包中比特数超过一个预定的门

限时，在下一个宏块的丌始处就创建一个新包。视频包中含有重新开始解码过程

所必要的信息。

(2)在重新建立同步之后，用数据恢复工具恢复前面丢失的数据。数据恢复

主要利用 RVLC(Reversible Variable Length Code)的逆向可解性进行。

(3)错误掩盖与刷新。首先将数据分区为纹理信息和运动信息两部分，中间

插一个标志位“motion marker”。若纹理信息发生错误，则用运动信息从上一个

解码的 VOP 中恢复出当前的纹理。错误刷新方法有两种，一是用帧内编码周期

性或自适应地刷新 VOP 或宏块；二是利用具有上行通道的帧间编码技术选择 J

下确的参考帧从而避免误差扩散，称为 NEWPRED 方式(高级实时简单框架所采

用)。NEWPRED 方式适用于实时通信环境，而帧内刷新不仅适用于实时通信，

而且可用

于广播和存储媒体。实际使用时可将两种方式结合起来。

2．2 双核 BF561 性能分析

Blackfin 系列 DSP 是 AnalogDevices 与 Intel 联合开发的体现高性能体系架

构的第四代 DSP 产品。这一新产品是专为通信和互联网应用而设计的通用处理

剩余45页未读，继续阅读

Mmnnnbb123

粉丝: 745
资源: 8万+

MPEG-4视频编码技术在ADSP-BF561 DSP上的实现与优化

mpeg---4视频编程技术研究--大学毕业(论文)设计.doc

mpeg-4视频编程技术研究-毕业(论文)设计论文.doc

MPEG_4视频编码技术的研究及实现

学士学位论文--嵌入式操作系统应用研究.doc

学士学位论文--nc加工自动编程技术.doc

学士学位论文--ssh加密技术研究及实现.doc

学士学位论文--智慧校园的数据处理技术.doc

学士学位论文--基于matlab的电子线路分析技术研究.doc

学士学位论文--基于单片机的万年历设计.doc

学士学位论文--多路数据采集系统.doc

最新资源