规模聚合网络：深度学习精准人群计数新方法

163 浏览量更新于2024-06-20 收藏 1.83MB PDF 举报

"本文介绍了规模聚合网络（SANet）在人群计数领域的应用，该网络设计用于准确和高效地计算密集人群的数量。SANet采用编码器-解码器结构，其中编码器利用尺度聚合模块捕获多尺度特征，解码器通过转置卷积生成高分辨率密度图。此外，研究者注意到现有方法通常只使用欧氏损失，忽视了密度图中的局部相关性，为此，他们提出了结合欧氏损失和局部模式一致性损失的新训练策略，提升了模型性能。他们还引入了归一化层简化训练，并使用基于补丁的测试方案减轻统计偏移问题。实验显示，SANet在四个主要人群计数数据集上表现优越，参数量少但效果超过现有最先进的方法。文章关键词包括人群计数、人群密度估计、尺度聚集网络和局部模式一致性。" 规模聚合网络（SANet）是一种深度学习模型，专为人群计数任务设计。它解决了传统方法在处理大规模、复杂人群图像时面临的遮挡、背景干扰、尺度变化和视角差异等问题。通过使用尺度聚合模块，SANet能够从不同尺度中提取特征，更好地适应不同大小的人体。这种多尺度表示对于处理人群图像至关重要，因为人群中的个体大小和位置可能有很大差异。在模型训练方面，SANet不仅仅依赖于欧氏损失，还引入了局部模式一致性损失。欧氏损失通常用于衡量预测密度图与真实密度图之间的距离，但它假设每个像素独立，忽略了密度图中像素间的相关性。局部模式一致性损失则考虑了这些相关性，帮助生成更清晰、更准确的密度图。同时，通过应用归一化层，模型的训练过程得到优化，减少了训练难度。在测试阶段，使用基于补丁的策略可以减少因全局统计偏移导致的误差。实验部分，研究人员在四个主流的人群计数数据集上验证了SANet的性能，结果表明，即使参数数量远少于其他先进方法，SANet仍能取得更好的结果。这证明了其在人群密度估计任务中的高效性和准确性。这种方法的进步对于提升公共场所的安全监控、人流管理等应用场景具有重要意义。

Cao等人

2.2

CNN方法

由于CNN出色的表示学习能力，基于CNN的作品在人群计数方面取得

了显着进展[25]介绍了基于CNN的计数方法的全面调查 Wang

等人

[26]

修改了AlexNet [27]，用于直接预测计数。 Zhang

等人

[28]提出了一种

卷积神经网络，该网络交替地由人群密度和人群计数训练。当部署到

新场景中时，使用类似于目标场景的训练样本在[29]中，Walach和

Wolf使用分层提升和选择性采样方法来减少计数估计误差。不同于现

有的基于补丁的估计方法，尚

等人。

[30]使用了一个网络，同时估计

整个输入图像的局部和全局计数。 Boominathan

等人

[31]用于生成密度图

的组合的浅层和深层网络。 Zhang

等人

[3]设计了多列CNN（MCNN）

来解决人群场景中的大规模变化。基于类似的思想，Onoro和Sastre [4]

也提出了一种称为Hydra的尺度感知网络，以提取不同尺度的特征最

近，受MCNN [3]的启发，Sam

et al.

[5]提出了Switch-CNN，它训练分

类器从特定输入补丁的多个独立回归量中选择最佳回归量。Sindagi

等

人。

[32，6]探索了通过学习各种密度水平并生成高分辨率密度图来

结合上下文信息的方法。为了提高密度图的质量，他们使用对抗损失

来克服欧几里得损失的限制。 Li

等人

[33]通过结合VGG-16 [34]和扩张

卷积层来聚合多尺度上下文信息，提出了CSRNet。

然而，通过观察这些最新的最先进的方法，我们发现：（1）大多

数工作使用多列结构来提取不同尺度的特征。正如在SEC中讨论的那

样。1，该架构的多尺度表示可能不足以处理由于有限的尺度多样性

而导致的大尺寸变化（2）[5，32，6]要求密度水平分类器提供上下文

信息。然而，这些额外的分类器显著增加了计算。此外，密度水平与

特定的数据集有关，并且难以定义。(3)大多数作品只使用像素欧几里

德损失，假设每个像素之间的独立性。虽然对抗性损失已经显示出密

度估计的改进，但密度图可能包含很少的高级语义信息。

基于以前的观察，我们提出了一个编码器-解码器网络，以提高性

能，而无需额外的分类器。此外，我们使用一个轻量级的损失，以加

强估计的密度图和相应的地面真理之间的局部模式的一致性

规模聚合网络

本节介绍

规模聚合网络（

SANet

）

的详细信息。我们首先介绍我们的网

络架构，然后给出建议的损失函数的描述。

剩余16页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

规模聚合网络：深度学习精准人群计数新方法

【PHP】基于ThinkPHP 5.0的考试系统tp5.zip

ssm-vue-新能源汽车在线租赁管理系统-源码工程-32页从零开始全套图文详解-34页参考论文-27页参考答辩-全套开发环境工具、文档模板、电子教程、视频教学资源.zip

三台松下的PLC一起通信控制16轴的程序，表格定位，用于固态硬盘的组装，精密度要求高，手动，自动、报景、空机运行等，程序写法新颖，清晰明了，注释清晰易懂，是学习多台PLC并联和定位控制非常好的栗子

ssm-jsp-多角色学生管理系统-源码工程-32页从零开始全套图文详解-34页参考论文-27页参考答辩-全套开发环境工具、文档模板、电子教程、视频教学资源.zip

【课程设计】基于pytorch实现Transformer模型的最简洁方式源码+模型+详细注释+运行说明.zip

ssm-jsp-车库智能管理平台-源码工程-32页从零开始全套图文详解-34页参考论文-27页参考答辩-全套开发环境工具、文档模板、电子教程、视频教学资源.zip

【课程设计】基于keil手机菜单系统仿真程序源码.zip

大数据存储HBase与Cassandra部署与应用实例-图书管理系统的构建

PDD盈利增长特训营教程

基于配电网有功电压控制的多智能体强化学习，python代码，可以发中文核心或者中文ei，非常好的代码

最新资源