带限坐标网络BACON:多尺度场景表示的分析与优化

0 下载量 25 浏览量 更新于2024-06-20 收藏 1.3MB PDF 举报
"带限坐标网络:多尺度场景表示的分析与优化" 这篇研究论文主要探讨了带限坐标网络(BACON),这是一种针对多尺度场景表示的新型神经网络架构。坐标网络,作为一种新兴的神经网络类型,已经在图像、视频、3D模型、音频等多种信号的表示和优化中展现出强大的能力。它们通过学习输入坐标的连续映射来输出信号值,避免了传统基于数组或网格的离散采样方法。 然而,当前的坐标网络存在一些局限性,例如它们通常是“黑盒”模型,其光谱特性不易分析,非监督点的行为难以预测。此外,这些网络通常只能在单一尺度上表示信号,导致简单的下采样或上采样可能引入伪影。为了解决这些问题,BACON引入了一种新的架构,能够分析并控制其傅立叶频谱,使得网络在无监督点处的行为受到约束,并可以根据信号的频谱特性进行设计。 BACON的独特之处在于它支持多尺度信号表示,无需在每个尺度上进行单独的监督训练。这通过网络的初始化和学习过程实现,使得它可以学习到信号的多分辨率分解。论文展示了BACON在图像、辐射场和3D场景表示中的应用,特别是在使用有符号的距离函数进行3D形状拟合时,它的性能优于传统的单尺度坐标网络,提高了可解释性和质量。 图1揭示了BACON如何通过分析光谱带宽在中间输出指定的尺度,以及如何在高分辨率信号的监督下学习多分辨率分解。网络的这种特性使其完全可以通过其傅立叶频谱来表征,从而限制了其行为,即使在没有监督的数据点上也能保持一致性。这克服了传统坐标网络对隐藏层大小、网络深度和输入坐标编码等超参数的复杂依赖,同时也解决了多尺度表示的挑战,使得滤波和抗混叠操作变得更容易。 BACON提供了一种更透明、更可控的多尺度场景表示方法,对于理解和优化复杂信号的表示具有重要意义,特别是在3D重建、视图合成、图像处理和神经渲染等领域的应用。这项工作为未来的研究提供了新的方向,有望推动神经网络在信号处理和表示领域的进一步发展。