3D运动估值法在模型基脸部运动参数估计算法中的应用与优化

需积分: 5 97 浏览量更新于2024-08-12 收藏 201KB PDF 举报

本文档深入探讨了"模型基编码中的脸部运动估值研究"这一主题，发表于2001年9月的《南京邮电学院学报(自然科学版)》。作者余兆明和曾针对模型基编码方案在运动参数估值方面的挑战，采用了三维运动估值的方法。他们提出了一个适用于人脸运动参数估值的运动模型和光流算法。运动模型在此背景下扮演了关键角色，它帮助理解并捕捉人脸在视频序列中的精确运动，这对于高效压缩和高质量的图像重建至关重要。光流算法，作为视觉跟踪的一种技术，通过计算像素点在连续帧之间的运动矢量，来估计图像中物体的运动。在模型基编码中，这种方法被用来估计和编码人脸的局部运动，以便在解码时能够准确地进行运动补偿，尤其是在低码率情况下，如可视电话传输中，这是提高图像质量的关键。论文不仅详述了算法的理论推导过程，还对其效果进行了详细的分析。通过比较与传统的H.261混合编码方案，作者指出模型基编码在处理极低码率图像时具有明显优势，因为它依赖于更真实的结构运动模型，能更好地适应这种高压缩需求。模型基编码进一步分为物体基和语义基编码，前者通过物体分割进行编码，后者则利用更高级别的抽象信息，如物体的语义特征，以实现更高的压缩效率。此外，论文还讨论了物体基编码的局限性，即由于模型中物体的不确定性增加，可能导致压缩比不如语义基编码。这表明了作者对于如何改进模型选择和参数估值策略的关注，以进一步提升编码性能。这篇论文在模型基编码领域的研究中，特别是在脸部运动估值和光流算法的应用上，提供了有价值的技术贡献，对于理解和优化低码率视频传输技术具有重要的学术价值。

第 21 卷第 3 期南京邮电学院学报 ( 自然科学版) Vol. 21 No.3

2001 年 9 月 Journal of Nanjing University of Posts and Telecommunications ( Natural Science) Sep. 2001

文章编号: 1000-1972( 2001) 03-0012-06

模型基编码中的脸部运动估值研究

余兆明, 曾

( 南京邮电学院信息工程系, 江苏南京 210003)

摘要: 主要针对模型基编码方案的运动参数估值问题, 运用 3 维运动估值的方法, 推导出运用于人脸

运动参数估值的运动模型和光流算法, 并对该算法的效果进行分析, 对算法的改进提出看法。

关键词: 模型基编码; 语义基编码; 3 维运动估值; 线框模型; 光流算法

中图分类号:TN919. 81 文献标识码: A

1 引言

在数字视频压缩中, 目前十分流行的方案是采

用H.261 建议的混合编码方案, 其特点是基于块的

DCT 和运动补偿的帧间预测编码。对于比特率大于

1.5 Mbit/s 的 CIF( 通用图像格式) 图像, 该编码方法

可得到令人满意的还原图像。然而对于极低码率编

码, 如通过现有电话网络传送 10 kbit/s 码率的可视

电话, 这种技术所提供的还原图像质量会随着码率

的减少而急剧下降。为适应极低码率图像传输的需

要, 产生了一系列采用新的运动补偿的编码方案, 一

般称为模型基或分析/综合图像编码。这种编码方

案基于更为真实结构运动模型, 更适用于极低码率

图像的传输。

模型基图像编码首先由瑞典 Forcheimer 教授提

出, 是一种基于景物 3 维模型的方法。通信双方有

一个相同的景物 3 维模型。基于这个模型, 在编码

器中用图像分析提取景物的参数, 如形状参数、运动

参数等。接收端的解码器根据这些参数用图像合成

技术重建图像。它充分利用了图像中景物的内容和

知识, 可以实现非常高的压缩比。

2 语义基图像编码

模型基编码根据所采用模型的不同类型分为物

体基图像编码和语义基图像编码两种。

收稿日期: 2000-10-18; 修回日期: 2000-12-27

物体基图像编码通过自动图像分析将输入图像

分解为若干个运动物体的区域, 并用 3 组参数分别

表示每个物体的运动、形状和亮色信息。由于模型

中物体的不确实性增大, 可利用的先验知识减少, 压

缩比要小于语义基编码。

语义基图像编码要求收发双方共有一个 3 维人

脸线框模型, 发送方采用 3 维运动估值和结构估值

技术跟踪线框模型的全局和局部运动以及结构变

化, 并将预测所得的运动和结构( 深度) 信息、变化了

的纹理信息编码送至接收方, 接收方用它们来恢复

下一帧图像, 该方法的编码框图见图 1。

图 1 语义基图像编码框图

建模是合成图像的关键步骤。为了使 3 维模型

投影为 2 维图像, 一般模型都采用线框的形式。根

据线框模型的形变不同, 现有的模型可分为几何模

型和生理模型。

根据测定参数所采用的手段, 可将运动估值方

法分为两类: 灰度法和光流法。另外, 在对待全局参

数和局部参数上, 也有两种方案: 一种方案是将两者

分开来测, 另一种方案是将全局参数和局部参数同

时测。

对局部运动参数估值是件困难的事情, 因为人

的表情变化是非刚体运动。但是我们可以采用一组

下载后可阅读完整内容，剩余6页未读，立即下载

weixin_38595689

粉丝: 4
资源: 910

3D运动估值法在模型基脸部运动参数估计算法中的应用与优化

拟人Agent面部运动模型：精确控制与表情描述

标准人脸三维建模及其在通信中的应用

基于深度卷积自动编码的3D面部重建与表情识别技术

拟人Agent面部运动模型研究 (2012年)

基于肌肉运动模型的自动3D面部表情识别

保罗·埃克曼-面部运动编码系统FACS中文版

Wav2lip预训练模型，包含人脸检测模型、面部表情生成模型、基于gan的面部表情生成模型、生成判别模型等

排球运动员的视野测定 (2001年)

matlab光照模型代码-FaceTracking:脸部追踪和面部标志追踪

centerloss:IJCV中“深度面部识别中心丢失综合研究”论文的源代码和模型-ce source code

最新资源