规模聚合网络:深度学习精准人群计数新方法

0 下载量 163 浏览量 更新于2024-06-20 收藏 1.83MB PDF 举报
"本文介绍了规模聚合网络(SANet)在人群计数领域的应用,该网络设计用于准确和高效地计算密集人群的数量。SANet采用编码器-解码器结构,其中编码器利用尺度聚合模块捕获多尺度特征,解码器通过转置卷积生成高分辨率密度图。此外,研究者注意到现有方法通常只使用欧氏损失,忽视了密度图中的局部相关性,为此,他们提出了结合欧氏损失和局部模式一致性损失的新训练策略,提升了模型性能。他们还引入了归一化层简化训练,并使用基于补丁的测试方案减轻统计偏移问题。实验显示,SANet在四个主要人群计数数据集上表现优越,参数量少但效果超过现有最先进的方法。文章关键词包括人群计数、人群密度估计、尺度聚集网络和局部模式一致性。" 规模聚合网络(SANet)是一种深度学习模型,专为人群计数任务设计。它解决了传统方法在处理大规模、复杂人群图像时面临的遮挡、背景干扰、尺度变化和视角差异等问题。通过使用尺度聚合模块,SANet能够从不同尺度中提取特征,更好地适应不同大小的人体。这种多尺度表示对于处理人群图像至关重要,因为人群中的个体大小和位置可能有很大差异。 在模型训练方面,SANet不仅仅依赖于欧氏损失,还引入了局部模式一致性损失。欧氏损失通常用于衡量预测密度图与真实密度图之间的距离,但它假设每个像素独立,忽略了密度图中像素间的相关性。局部模式一致性损失则考虑了这些相关性,帮助生成更清晰、更准确的密度图。同时,通过应用归一化层,模型的训练过程得到优化,减少了训练难度。在测试阶段,使用基于补丁的策略可以减少因全局统计偏移导致的误差。 实验部分,研究人员在四个主流的人群计数数据集上验证了SANet的性能,结果表明,即使参数数量远少于其他先进方法,SANet仍能取得更好的结果。这证明了其在人群密度估计任务中的高效性和准确性。这种方法的进步对于提升公共场所的安全监控、人流管理等应用场景具有重要意义。