没有合适的资源?快使用搜索试试~ 我知道了~
首页MPEG-4视频编码技术在ADSP-BF561 DSP上的实现与优化
MPEG-4视频编码技术在ADSP-BF561 DSP上的实现与优化
0 下载量 5 浏览量
更新于2024-06-24
收藏 1.09MB DOC 举报
"MPEG-4视频编程技术研究主要探讨了如何在ADSP-BF561 DSP上实现MPEG-4视频编码的实时处理。该文深入解析了MPEG-4编码技术,包括其对象编码思想,高压缩比,可扩展性和可交互性的特性。在选择ADI公司Blackfin系列的DSP作为平台的基础上,文章详细阐述了选用BF561的原因,主要是因为其在图像处理性能和成本效益方面的优势。 MPEG-4编码技术的核心包括DCT(离散余弦变换)和运动估计。文中对这两种核心算法进行了优化研究,提出了基于起点预测的改进菱形运动估计算法,以提升运动向量预测的精度。此外,考虑到BF561的双核结构,设计了一种宏块层并行算法,以充分利用处理器的计算能力。 在实现方面,论文详细介绍了MPEG-4简单框架编码器的软件实现方案,包括在VC++环境中用C语言实现的视频压缩功能。同时,针对硬件平台的特性,对存储器配置、DMA(直接存储器访问)控制和代码进行了优化,确保编码器能在BF561上实现CIF(Common Intermediate Format)格式30帧/秒的编码速度,达到预期的性能目标。 在绪论部分,论文强调了视频编码在信息化社会中的重要性,尤其是在数字化视频信息的存储和传输中的挑战。从电影和电视的发展到数字技术的应用,视频信号的处理始终伴随着数据量巨大的问题。通过视频编码技术,可以有效解决这一问题,使得高清视频能在有限的带宽和存储空间下得以传播和利用。 这篇学士学位论文深入研究了MPEG-4视频编码技术,不仅理论分析了其关键技术,还通过实验证明了在特定硬件平台上实现高效编码的可行性。这为未来在嵌入式系统中应用MPEG-4编码提供了重要的参考和实践指导。"
资源详情
资源推荐
AV(Audio Video)In]x,-t 象是 MPEG.4 为支持基于内容编码而提出的重要概
念。对象是指在一个场景中能够访问和操纵的实体,对象的划分可根据其独特的
纹理、运动、形状、模型和高层语义为依据。在 MPEG-4 中所见的视音频己不
再是过去 MPEG-l、MPEG.2 中图像帧的概念,而是一个个视听场景(AV 场景),
这些不同的 AV 场景由不同的 AV 对象组成。AV 对象是听觉、视觉、或者视听
内容的表示单元,其基本单位是原始 AV 对象,它可以是自然的或合成的声音、
图像。原始 AV 对象具有高效编码、高效存储与传输以及可交互操作的特性,它
又可进一步组成复合 AV 对象。因此 MPEG.4 标准的基本内容就是对 AV 对象
进行高效编码、组织、存储与传输。AV 对象的提出,使多媒体通信具有高度交
互及高效编码的能力,AV 对象编码就是 MPEG-4 的核心编码技术。
MPEG-4 不仅可提供高压缩率,同时也可实现更好的多媒体内容互动性及全
方位的存取性,它采用开放的编码系统,可随时加入新的编码算法模块,同时也
可根据不同应用需求现场配置解码器,以支持多种多媒体应用【12】。
MPEG-4 采用了新一代视频编码技术,它在视频编码发展史上第一次把编码
对象从图像帧拓展到具有实际意义的任意形状视频对象[13】,从而实现了从基于
像素的传统编码向基于对象和内容的现代编码的转变,因而引领着新一代智能图
像编码的发展潮流。
2.1.3 MPEG.4 的框架及应用场合
MPEG.4 的应用领域非常广泛,即可以用于高质量的数字电视,也可以用
于极低码率的无线多媒体通信,还可以进行交互式处理,为了适应各种应用对编
码特性的需求,同时满足编码结构的清晰,MPEG-4 设计了各种层次的框架
(Profile)结构【¨】,以适应于不同领域的编码需求。每一个框架下定义了多个级
(Level),用于限制计算的复杂度,也适应于不同编码领域的细分要求,具有很大
的灵活性。MPEG.4 中的 Profile@Level 组合形式,其作用是:允许编码器的厂
家仅仅实现标准的子集,加上上级子集对下级子集的全兼容,这样可以最大限度
的实现与其他 MPEG-4 设备的互通。
由于 MPEG-4 是一个完整的多媒体应用框架【l 51,设计的范围非常广泛,
视频编码仅仅是其中的一部分,而且涉及到编码部分就包含自然景物、三维图像
等领域。结合目前图像分割技术的不完善,本文仅仅研究基于矩形编码类的框架。
所以,考虑表 2.1 所列三类编码框架。
本课题研究的 CIF 格式实时 MPEG.4 编码系统,因为高级简单框架涉及
B.VOP 编码,具有后向预测部分,需要根据视频对象平面组层的排列,存储多
帧数据,不利于实时处型 16】。对比而言,简单编码框架(Simple Profile),虽然
在编码的压缩率方面存在一定的损失,针对本课题实时编码的研究,压缩率上的
损失是可以接受,并因其编码的复杂度最低,具有很好的成本控制能力,所以本
课题选用该框架结构。
2.1.4 MPEG.4 SP 框架的关键技术分析
MPEG-4 是 MPEG 系列的最新发展,其借鉴了其他视频标准的优秀算法,
并在其基础上进行了一系列的改进。本章节重点介绍课题应用的 SP 框架关键的
技术,为后续章节的论述,打下基础。
1.I-VOP/P-VOP
MPEG-4 编码的基本单元是 VOP(Video Object Plane),相对于以前编码标准
中“帧’’的概念。
I-VOP:帧内 VOP,称为 I 帧。I-VOP 是独立压缩编码的,不需要其他 VOP
作为参考。是后续的 P-VOP 所需运动估计的参考点,因此,在视频码流中需要
周期性的插入 I-VOP。
P-VOP:帧间 VOP,称为 P 帧。利用前一帧编码的 I—VOP 或者 P-VOP 做
帧间预测编码。为了减少编码误差,所使用的预测参考帧不是那帧图像的原始图
像,而是该帧的重构帧。
在实际的编码中,一个视频对象组(GOV)包括一个 I—VOP 和多个 P-VOP。
开始的是 I-VOP,其与前面的 VOP 无依赖关系,可以独立编码,因此出现误码,
也不会传播到下面的 GOV,后面的是 P-VOP,其参考重构的 I—VOP 编码,提
高码流压缩率。
2.运动估计补偿技术
运动估计补偿技术 n71 其主要目的是除去视频序列的时域相关性,其基本的
原理这里不进行叙述。运动估计补偿模块是编码标准的关键算法:其很大程度上
决定编码的效率。好的运动估计算法可以快速确定匹配的运动估计向量,大大减
少计算量,提高编码速率。据估计,运动估计算法占到编码计算量约 60%,对
编码速度的影响很大。
目前,MPEG-4 编码验证模型采用的运动估计算法是钻石搜索法,又叫菱形
搜索法。本课题对其进行了细致的研究,并进行了较大的改进,详细论述见章节
3.2。
下面主要介绍 MPEG 一 4 SP 框架区别于以前编码标准的一些特点:
(1)1/2 或者 1/4 像素精度估计
考虑到前后两帧的物体运动不一定是整数像素,为提供运动估计的精度,需
要在 1/2 或者 1/4 像素位置内插一个参考帧。可以提高估计精度,但增大了运
算开销和存储容量。
(2)无限制运动向量
无限制运动向量(UMv)¨砌通过填充技术,针对边界处的宏块,根据搜索窗
口的大小,等值扩充边界,提高搜索精度。因运动向量超出原有图像的边界,因
此称为无限制运动向量。
(3)四运动向量模式
16*16 的亮度宏块可以作为一个整体进行运动补偿 n91,或者作为 4 个 8*8
块单独进行运动补偿,即为四运动向量模式,每个 8*8 的亮度块对应于一个运动
向量,小尺度的块更适应于图像细节部分的运动估计,提高编码压缩率。
3.容错性
由于 MPEG-4 的应用范围很广,为了有效的消除错误的影响,MPEG-4 提供
了三种错误恢复工具:再同步、数据恢复和错误掩盖与刷新啪 3。
(1)再同步机制类似 MPEG-2 的 slice 层语法提供的功能。在 MPEG-4 中以视
频包作为再同步单位瞳¨,由于错误发生的随机性和码字的不均匀性,MPEG
一 4 决定使用固定比特数的视频包。如果当前视频包中比特数超过一个预定的门
限时,在下一个宏块的丌始处就创建一个新包。视频包中含有重新开始解码过程
所必要的信息。
(2)在重新建立同步之后,用数据恢复工具恢复前面丢失的数据。数据恢复
主要利用 RVLC(Reversible Variable Length Code)的逆向可解性进行。
(3)错误掩盖与刷新。首先将数据分区为纹理信息和运动信息两部分,中间
插一个标志位“motion marker”。若纹理信息发生错误,则用运动信息从上一个
解码的 VOP 中恢复出当前的纹理。错误刷新方法有两种,一是用帧内编码周期
性或自适应地刷新 VOP 或宏块;二是利用具有上行通道的帧间编码技术选择 J
下确的参考帧从而避免误差扩散,称为 NEWPRED 方式(高级实时简单框架所采
用)。NEWPRED 方式适用于实时通信环境,而帧内刷新不仅适用于实时通信,
而且可用
于广播和存储媒体。实际使用时可将两种方式结合起来。
2.2 双核 BF561 性能分析
Blackfin 系列 DSP 是 AnalogDevices 与 Intel 联合开发的体现高性能体系架
构的第四代 DSP 产品。这一新产品是专为通信和互联网应用而设计的通用处理
剩余45页未读,继续阅读
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功