基于先验与学习的超分辨率重建与视频处理方法

需积分: 10 4 下载量 5 浏览量 更新于2024-07-28 收藏 3.4MB PDF 举报
"UCSD 博士论文 Priors and Learning Based Methods for Super-Resolution" 这篇博士论文探讨了基于先验和学习方法的超分辨率以及其他视频处理应用。作者提出了新的技术和算法,旨在提高图像恢复质量和视频处理的效率。 首先,论文提出了总子变差(Total Subset Variation, TSV)作为总变差(Total Variation, TV)的推广,以保留凸性。TSV 是针对高阶团MRF的一种先验,其可微近似使得它适用于大型图像处理,例如1080p分辨率的图像。TSV先验也扩展到了向量值数据,可以应用于彩色图像和运动场。此外,论文提出了一种对亚指数分布的凸松弛作为优化问题参数的确定准则,该问题来源于TSV先验。在超分辨率应用中,实验显示与TV和其他方法相比,TSV能显著降低重建错误,提高PSNR(峰值信噪比)和SSIM(结构相似度)指标。 其次,论文介绍了一种基于ν支持向量回归的图像上采样算法。该算法工作在像素域内,利用矩形区域的邻域信息来确定高分辨率像素。由于上采样涉及匹配测试区域与训练区域(支持向量)的相似性,这种方法能自适应局部图像内容。同时,研究还探索了ν支持向量回归在压缩失真减少中的应用。 对于全局运动估计,论文提出了一种快速且稳健的二维仿射全局运动估计算法,它基于傅立叶-梅林域的相位相关和稀疏运动矢量场的稳健最小二乘拟合。与传统方法不同,该算法在图像金字塔最粗层上获取旋转-缩放-平移(RST)的近似参数,确保了更大范围运动的收敛性。尽管在低分辨率级别工作,但亚像素精度的相位相关提供了足够精确的粗略估计,供后续的细化阶段使用。细化阶段采用RANSAC(随机抽样一致性)进行稳健的最小二乘模型拟合,该拟合基于在图像金字塔最细层随机选择的高活动区域的块级亚像素精度相位相关计算出的稀疏运动矢量场。这种方法对前景物体和平坦区域等异常值非常鲁棒,实验证明,它能在比MPEG-4验证模型更大的运动范围内进行准确估计,同时实现200倍的速度提升。 最后,论文强调了自然视频单帧统计特性以及不同帧之间运动估计的组合先验对于任何通用视频处理应用的重要性。这些综合方法能够提高整体性能,适应各种复杂的视频处理任务。