深度学习驱动的视频帧序列高效压缩法

12 下载量 47 浏览量 更新于2024-08-29 3 收藏 1.53MB PDF 举报
本文主要探讨了一种基于深度学习的创新视频图像再压缩方法,针对传统压缩技术存在的帧间数据压缩比例不高的问题,提出了一个针对视频片段的高效压缩策略。这项工作发表在《电子设计工程》的第27卷第11期,2019年6月,作者郝小龙等人。 传统的视频压缩技术主要侧重于帧内数据的压缩,通过分析视频帧内的空间信息来减少数据量。然而,随着移动设备显示分辨率的提升和全景相机、VR头盔等新技术的普及,对视频压缩的需求也在增加,尤其是对于4K甚至8K视频的传输和存储提出了更高的要求。为此,本文提出了一种深度学习驱动的解决方案。 首先,利用时空卷积神经网络(Temporal Convolutional Neural Network, TCNN)对连续的视频帧序列进行智能分类。这种方法将视频片段划分为剧变、渐变和普通三个类别。剧变和渐变反映了视频内容的快速或平滑转换,而普通类别则用于处理相对稳定或变化较小的视频片段。 对于普通视频片段,该方法进一步进行了关键帧提取。关键帧不仅包含帧内的重要信息,还能有效地代表整个片段的内容。通过这种方式,文章提出的新方法能够在保持重构质量不变的前提下,显著降低H.264/AVC和HEVC编码标准的平均码率。具体来说,与传统方法相比,新方法可以分别将H.264/AVC的平均码率降低57.62%,HEVC的标准码率降低8.37%。 这种方法的优势在于它不仅关注帧内数据,还考虑了帧间的冗余信息,通过深度学习模型的智能分析,提高了压缩效率,这对于移动设备和网络传输来说无疑是一项重要的技术突破。这种创新方法为解决高分辨率视频的压缩需求提供了新的思路,为未来的视频技术发展奠定了基础。