新型球形CNN提升360°视频显著性检测的效率与精度

64 浏览量更新于2024-06-20 收藏 1.18MB PDF 举报

本文探讨了360°视频显著性检测领域的创新方法，即通过设计一种新型的球形卷积神经网络（Spherical Convolutional Neural Network, SCNN）来解决这一问题。传统上，显著性检测主要针对具有有限视场（FoV）的图像或视频，而360°视频则提供了全景视角，这使得传统的检测方法不再适用。球面卷积的核心在于其核定义在球冠上，且卷积操作考虑到内核在球体上的旋转，这与传统二维平面卷积有显著区别。作者指出，360°视频通常以等矩形全景图的形式存储，这意味着在进行检测时，需要处理图像变形的问题。为了提高效率和连贯性，他们提出了一种新的策略，即在卷积过程中根据视频片段位置动态调整核的旋转，同时结合时间连续性，使用球形U-Net结构来进行顺序显著性检测。作者还强调了建立大规模的360°视频显著性检测基准的重要性，该基准包含104,360个经过20多位人类受试者观看的视频数据，这有助于评估模型的性能和泛化能力。实验结果显示，球形U-Net在360°视频显著性检测任务上表现优异，相较于传统的全景分割和局部透视投影方法，其能够提供更高效且稳健的解决方案。本文的关键贡献在于提出了一种全新的SCNN架构，以及在360°视频处理中的显著性检测方法，这对虚拟现实（VR）和增强现实（AR）应用具有重要意义。研究者们希望通过这种方法，更好地模拟人类在探索3D环境时的注意力分布，从而提升用户体验。本文的关键词包括球面卷积、视频显著性检测、360°VR视频，反映出作者对360°视频处理技术前沿的关注和对提升视觉注意力模拟的深入探究。这项工作在360°视频分析领域具有开创性意义，为进一步的研究和实际应用奠定了坚实的基础。

Zhang，Yanyu Xu et al.

将球面图像重复投影到所有位置处的切平面，并在这些平面上进行卷积。虽然

这样的解决方案提高了精度，但它也带来了昂贵的计算成本。此外，不相交的

投影平面使得中间表示不能被更高层卷积共享最近，Cohen

等人。

[16]在SO

（3）流形上提出了一种新型的球面CNN，他们的解是表达性和旋转等变的。

利用快速傅里叶变换，可以大大加快求解速度。然而，SO（3）CNN的概念并

不那么符合我们处理2D球形图像的直觉，并且与规划器CNN的概念截然不同。

尽管已经提出了许多用于球形数据的CNN模型，但没有一个用于360

◦

视

频。实际上，当我们改变360

视频中的FOV时，我们的大脑实际上使用相同的

机制来探索环境。换句话说，用于显著性检测的k核应当在所有视图之间共享。

这促使我们设计一种新型的球形CNN：我们定义具有球冠形状的核，我们在球

极坐标系上旋转核并将核与片卷积。

通过这种方式，可以共享内核因此，我们

的解决方案对于360

◦

视频中的显著性检测更自然，

2.2

视频显著性检测

已经做了许多努力来研究视频显着性检测，无论是基于手工制作的特征的方法

[17][18][19] [20]，还是基于深度学习的方法[21][22] [23][6][24]，但360

◦

视频中

视频显着性检测的研究仍处于初级阶段。[25][12]是沿着这个方向的两个先驱工

作，但这些工作中使用的360

◦

实际上，具有动态内容的视频在实际应用中更常

见。为了了解动态360

◦

视频中人类的行为，特别是360

◦

体育视频，Hu

等人

提出

通过将投影的全景图像直接输入CNN来预测显著对象。但是，没有考虑投影的

失真，这将降低精度。此外，显著对象是人工标注的，不一定能反映人类视觉

注意的真实行为。为了更好地理解用户据我们所知，这是第一个在360

视频中

进行眼睛注视预测的工作。我们还建立了一个数据集，以便于评估我们的工

作。

由于球面图像通常以平面格式存储，因此我们将球面图像等矩形投影到欧氏平面上，

然后根据待卷积的投影块的形状对核进行重采样，再将目标块与变换后的核进行卷

积。

剩余15页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

新型球形CNN提升360°视频显著性检测的效率与精度

基于全卷积神经网络的空间目标检测追踪算法.pdf

卷积和全连接神经网络实现手写数字识别.docx

deepsphere-cosmo-tf1:用于宇宙学的球面卷积神经网络 (TFv1)

如何设计一种新型的球形卷积神经网络（SCNN）来提升360°视频显著性检测的效率与精度？

在360°视频中，如何通过新型球形卷积神经网络（SCNN）优化显著性检测的计算效率和准确性？

在360°视频中，如何实现高效的显著性检测，以及球面卷积神经网络（SCNN）在此过程中的关键作用是什么？

卷积神经网络如何处理稀疏点云

单阶段三维目标检测需要进行特征提取吗

matlab 中mauchly球形检验

和Bartlett球形检验p值合理范围

最新资源