深度残差网络的迁移学习：人员身份重新识别的效果

78 浏览量更新于2024-01-02 收藏 1.46MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

智能系统与应用16（2022）200137深度剩余网络与迁移学习型人才重新识别Arpita Guptaa，*，Pratik Pawadeb，Ramadoss Balakrishnan ba印度海得拉巴Koneru Lakshmaiah教育基金会计算机科学与工程系b印度Tiruchirappalli国家技术学院计算机应用系A R T I C L EI N FO保留字：深度残差网络深度学习A B S T R A C T人的再识别是从不同角度对人进行识别的一个领域，在监控中起着重要的作用。面对面re-id的主要问题之一是大型标记数据集的不可用，这限制了深度学习模型的性能。在这项研究中，我们对使用迁移学习训练的深度残差网络进行了不同的实验，然后对预训练的模型进行了微调。这些模型在更大的数据集ImageNet上进行了预训练，以更好地学习视觉特征。该模型基于深度残差网络，因为它更好地理解和理解视觉特征，从而导致更好的分类。该模型在Market-1501数据集上进行了评估，该数据集由从6台相机收集的1501个身份组成。本文研究了超参数的影响，以提高精度。该模型取得了最高的mAP得分68.4%，提高了5.3%，Rank-1的得分为96.0%，提高了12.4%。该模型的性能优于在Market 1501数据集上以监督方式训练的所有现有模型实验结果表明，即使在没有大规模标记数据集的情况下，该模型也可以帮助更好地解决人员身份识别问题，并可以用于更好的安全和监控。介绍最近的技术进步导致了摄像机网络在所有公共场所，如机场，学校，大学和其他地方。这使我们能够覆盖广泛的区域跨度，并具有非重叠的视野，以实现更好的覆盖（Peng，Xiang，Wang，Pontil，Gong，Huang，&Tian，2016）。从这些网络收集数据已经产生了大量的数据，可以出于安全或其他目的进行分析深度学习、模式识别和计算机视觉等领域在分析这些数据以获得可以帮助人类日常生活的装备方面发挥着至关重要的作用，但这些收集的数据没有正确标记，这导致我们进行迁移学习（Grigorev，Tian，Rho，Xiong，Liu Jiang，2019&）。分析这些数据可以帮助发现犯罪模式，搜索被盗车辆，人员重新识别和其他领域。（彭翔，王鹏，龚，黄，田，2016&;白，杨，黄，窦，于，徐，&2020）个人识别背后的动机是将一个人与探头示例与从摄像机收集的图库数据（Zhao， Ouyang ，Wang ，2013&）。主要的挑战是相机视图，照明，人体角度，障碍物，分辨率和背景（Zhao，Ouyang &Wang，2013）。识别是通过将探测图像与图库数据集进行匹配来找到人&的位置或跟踪它以用于其他应用（Zheng，Shen，Tian，Wang，Wang Tian，2015）。有两种方法：首先，探针图像中的开放世界匹配可能存在于图库数据集中，也可能不存在于图库数据集中，因此将创建新的类以用于未来的识别分类（Bedagkar-Gala，&Shah，2014; Zheng，Yang，&Hauptmann，2016;一个人并不总是可能是已知的人。开放世界的设置更现实，更有用，但很难实现。开放世界识别已经被探索过（ Bedagkar-Gala Shah ，2014&）;他们讲述了开放世界的有用性，它的应用，以及所做的工作。有多种模型集中在特征表示上;在其中一项工作中，用于同时特征表示优化和软像素注意力和硬区域注意力组合学习的和谐注意力CNN（HA-CNN）模型用于改善不受控制（未对齐）图片中的人识别（Li，Zhu，Gong，2018&），在另一项研究中，局部特征学习通过找出两组局部特征之间的最短路径进行对齐/匹配，大大增强全局特征学习，并且不需要* 通讯作者：印度海得拉巴科内鲁·拉克什迈亚教育基金会计算机科学与工程系联系电话：+91-9407885161。电子邮件地址：arpitagupta2993@gmail.com（A. Gupta），pppratikpawade7@gmail.com（P. Pawade），brama@nitt.edu（R. Balakrishnan）。https://doi.org/10.1016/j.iswa.2022.200137接收日期：2022年4月30日;接收日期：2022年9月27日;接受日期：2022年10月5日2022年10月12日在线提供2667-3053/© 2022作者。由Elsevier Ltd.发布。这是CC BY-NC-ND许可证下的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。可在ScienceDirect上获得目录列表智能系统及其应用杂志主页：www.journals.elsevier.com/intelligent-systems-with-applicationsA. Gupta等人智能系统与应用16（2022）2001372×额外的监督。在这项研究中，仅使用了联合学习后计算图片相似度的全局特征（Zhang，Luo，Fan，Xiang，Sun，Xiao，Jiang，Zhang，Sun，2017&），在一项研究中，这是CNN架构首次考虑人体形状信息以加速特征学习（ Zhao ， Tian ， Sun ， Shao ， Yan ， Yi ， Wang ， Tang ，2017&）。还有一些研究致力于距离度量;一项研究表明，使用三重丢失的变化来实现端到端的深度度量学习，对于从头开始学习的模型和经过预训练的模型来说，远远超过了大多数其他报告的方法。（Hermans，Beyer &Leibe，2017），在另一项研究中，Margin Sample Mining Loss（MSML）是一种具有硬样本挖掘的新型度量学习损失，与现有的度量学习损失（如三重损失）相比，可以实现更高的准确性（Xiao，Luo&Zhang，2017）;在一些常用的数据集上，通过在一项研究中在Resnet50上集成SN损失，可以获得比最先进的结果更好的结果（Li，Ding，Li，Zhang &Fu，2018）;基于单个ReID的四重损失，建议使用基于边缘的在线硬负挖掘的四重深度网络（Chen，Chen，Zhang &Huang，2017）;与传统度量学习损失（如三元组损失）相比，提出了一种新的基于硬样本挖掘的度量学习损失，称为边际样本挖掘损失（MSML）（Xiao，Li，Wang，Lin Wang，2017&）或两者。的最新进展深度学习导致了深度re-id，这在视野方面表现出了显着的改善（Chen，Wang，Shi，Yan，Geng，Tian &Xiang，2018）;在一项研究中，考虑了现实的无监督学习环境，并且证明了我们的模型可以推广到新的RE-ID数据集而无需任何进一步的调整。（Qian，Fu，Xiang，Wang，Qiu，Wu，Jiang，Xue，2018&）;在另一项研究中，一个由许多来源组成的网络，用于跨域人员重新识别（ Wei ， Zhang ， Gao ， Tian ，2018&）。许多问题都有一个广泛的多类标记数据集，而面对面的re-id缺乏大型标记数据集，收集数据集是一项艰巨的任务（Chen，Wang，Shi，Yan，Geng，Tian Xiang，2018&）。数据集，最大的人re-id，大小刚刚好。因此，为了克服小训练集的这个缺点，使用迁移学习，其中模型在较大的数据集上训练，然后在人员re-id数据集上进行测试。训练是在一个非常大的数据集上完成的，然后对模型进行微调和测试，这有助于克服由于在person re-id中不存在大型数据集而造成的差距。其中一个非常大的数据集是ImageNet，它非常受欢迎并成功地用于迁移学习。ImageNet（Deng，Dong，Socher，Li，Li，Fei-Fei，2010&）是一个包含数百万个对象类别的图像的数据集，已被证明可以胜任特定任务的预训练模型。使用ImageNet预训练person re-id模型存在一些问题。ImageNet对象分类与person re-id非常不同，并且person re-id数据集的分辨率低于ImageNet图像，因为它是从CCTV摄像机网络收集的。然而，该模型可以被设计为从ImageNet传输知识，并用于个人re-id。以下文件已组织：第2节解释了基于深度网络、迁移学习和其他技术的人re-id的相关工作。第3节描述了基于迁移学习和微调的模型。建议的模型部分解释了模型的工作原理及其体系结构。第4节描述了性能评估，所提出的模型取得的结果，以及所使用的数据集的详细信息，然后是第5节结论。相关工作人re-id中的E-x方法已经使用了距离度量学习（Hirzer，Beleznai，Roth，Bischof，2011&;而不是手动创建单个特征来解决问题，它们使用我们对情况的了解构建特征空间，然后允许机器学习算法选择哪种表示方法有效（Gray Tao，2008&）;另一个研究开发利用一个单一的代码包，其中包含22个指标学习和排名的方法和11个特征提取算法。（Karanam，Gou，Wu，Rates-Borras，Camps，Radke，2019&），区分子空间学习（Liao，Hu，Zhu，Li ， 2015& ），学习排名（ Paisitkriangkrai ， Shen ， Van DenHengel，2015&），或深度学习，其中相似性度量和学习特征同时完成（Ahmed，Jones Marks，2015&）。Person Re-id从探头组中获取图像，并与图库图像进行距离比较或特征在这项研究中，更好的特征理解是集中，这是迁移学习的关键。在更大的数据集上训练不同的模型，ResNet-18，ResNet-34，ResNet-50（He，Zhang，Ren Sun，2016&）和ResNeXt-50 32 4d（Hu，Shen，Sun，2018&），以克服人re-id字段中较小数据集的问题，并在本研究中在我们的架构中使用SoftMaxZheng，Yang &Zheng等人的研究， 2017）探索了两种模型的组合，以使用暹罗网络更好地区分行人描述符。迁移学习深度学习中的迁移学习技术在所有没有大型标记数据集的领域都受到了广泛关注（Peng，Xiang，Wang，Pontil，Gong，Huang，Tian ， 2016&;Chen ， Wang ， Shi ， Yan ， Geng ， Tian Xiang ，2018&）。迁移学习中最常见的设计是微调，首先在较大的数据集上对网络进行预训练，然后从预训练的模型中，针对目标网络选取一些层，然后对所有或部分层进行微调以获得所需的网络。一项关于迁移学习的研究证明，源和目标差异的增加会导致泛化能力降低，这是迁移学习的障碍之一（Peng，Xiang，Wang，Pontil，Gong，Huang，Tian，&2016）。增加网络的深度是没有用的，而层中转换的变化可能会带来更好的性能。其中一项研究探讨了相机的动态特性（Ahmed，Lejbolle，Panda，Roy-Chowdhury，2020&）。另一项研究提出了无监督人re-id的分类和潜在共性（Tian，Teng，Zhang，Wang，Fan，2021&），这与我们的工作完全不同。其他几项研究表明，多任务联合方法，训练是为一个人re-id设计的，其目的是减少源数据集和目标数据集之间的不一致性，这有助于减少区域的边界差异（Peng，Xiang，Wang，Pontil，Gong，Huang，Tian，2016&;Chen，Wang，Shi，Yan，Geng，Tian Xiang，&2018）。如果源数据集与目标数据集的区域相似，性能会更好，因为区域边界的不一致性较小，而使用不同的区域数据集进行训练和测试有点不合适，这导致我们使用它进行微调以获得更好的结果。研究表明，将联合学习与多任务学习和微调相结合与不同区域的数据集训练和测试任务不兼容（Chen，Wang，Shi，Yan，Geng，TianXiang，&2018）。损失函数为了确定神经网络如何有效地表示训练数据，使用损失函数来比较目标和预期输出值。期望输出和目标输出之间的这种损失是我们希望在整个训练过程中减少的。在一项研究中，为了让卷积神经网络（CNN）学习角度判别特征，他们提出了角度softmax（A-Softmax）损失。A-Softmax损失可以在几何上被视为对超球面流形施加歧视性约束，这与面也位于流形上的假设相一致（Liu，Wen，Yu，Li，Raj，Song，2017&）。其中一个证明了采用三元组损失的变体来实现端到端深度度量学习胜过大多数其他方法。A. Gupta等人智能系统与应用16（2022）2001373××××+=报告的方法对于从头开始学习的模型以及已经预先训练的模型有很大的优势（Hermans，Beyer，&Leibe，2017）。另一项研究&建议的学习嵌入策略与结构化损失目标在解除问题上的效果明显优于现有的方法在所有尝试嵌入维度与谷歌神经网络（宋，Xiang，Jegelka，Savarese，2016）。根据一项研究，实例损失为排名损失提供了更好的权重初始化，允许学习更具区分性的嵌入（Zheng，Zheng，Garrett，Yang，Xu，Shen，2020&）。在另一项研究中，两种基本的深度特征学习方法，即使用类级别标签和成对标签的学习，都有一个统一的循环损失公式。通过比较循环损失与损失函数优化技术，我们分析证明了循环损失为更具体的收敛目标提供了更灵活的优化策略（Sun，Cheng，Zhang，Zhang，Zheng，Wang，&Wei 2020）。神经网络的关键部分之一是损失函数。损失只不过是神经网络的预测错误。损失函数是用于计算损失的过程的名称。简单地说，梯度是使用损失计算的。有监督的领域自适应学习监督域自适应是一种迁移学习技术，其中所有训练样本都被标记。域自适应是迁移学习中的一门学科，其中模型从不同的域数据集学习，并在数据集的各个域上执行相同的任务。自适应是从一个域数据集完成的，并应用于不同的数据集。我们的模型使用这个任务，从一个学习，并在另一个监督下放置。这项研究比较了基于转移学习的深度残差网络，在更大的数据集上进行了预训练，并将ImageNet用于人员重新识别。我们提出的模型使用了SoftMax损失函数和微调。本研究提出了一种基于监督域自适应的深度残差网络模型，并将其与不同的变体进行了比较。此外，在基准Market1501（Zheng，Shen，Tian，Wang，Wang Tian，2015&）数据集上评估了网络。该模型概述网络架构主要由深度残差网络（ResNet）组成，并比较不同类型的ResNet，以找到哪种网络将满足一个人的re-id的要求。该网络旨在区分视觉上不同类别的图像。这些网络将标记的领域数据集作为训练网络的输入，然后使用基准数据集上的其他领域知识来完成必要的工作。该网络架构使用SoftMax损耗和微调。我们的基础网络由ResNet组成，并比较了它的不同变体，它从输入的标记训练集中学习特征或表示。在这项研究中，ResNet-18，ResNet-34，ResNet-50和ResNeXt-50 32 4D进行了实验。ResNet被广泛用于人的re-id模型，并被选中，因为该网络在其他计算机视觉任务中表现出了很好的效果。使用ResNet很有帮助，因为它可以很容易地从我们的大型训练数据集ImageNet中概括图像的特征，并且已经显示出有希望的结果。此外，还使用了两步调整，如（Chen，Wang，Shi，Yan，Geng，Tian Xiang，2018&）所建议的那样，它通过随机初始化完全改变了预训练模型的SoftMax层，然后逐层冻结，以了解哪一层不应该改变，因为一步微调在我们的模型中没有帮助。这种微调技术帮助我们实现了我们的结果。迁移学习在这项研究中，使用迁移学习技术来训练深度模型。本研究的目的是寻找一个能够从大规模训练数据集中学习特征的模型，并在人识别任务中评估结果。在这项研究中，使用网络的预训练层（ResNet-18，ResNet-34，ResNet-50（Chen，Wang，Shi，Yan，Geng，Tian Xiang，2018&）和ResNeXt-50 32 4D（Hu，Shen，Sun，&2018）），从大型训练数据集中提取特征并进行微调以获得所需的网络。此外，还比较了ResNet的四种变体：ResNet-18、ResNet-34、ResNet-50和ResNeXt-5032 4D。这种方法已被证明是有效的，因为它给出了更好的结果比任何其他在不同数据集上训练的监督模型都要好ResNetResNet也被称为深度剩余网络，因为它的剩余连接有助于更好地在网络中传递信息。剩余连接，类似于跳过连接，提供了一种直接通过网络传播梯度的方法（Chen，Wang，Shi，Yan，Geng，Tian Xiang，2018&）。这些跳过连接有助于考虑全局特征并跳过层，这有助于通过减少时间和优化网络层来进行训练。ResNet中有一个反向传播，这有助于消除消失梯度问题。ResNet于2015年提出，并在ImageNet上的ILSVRC（图像大规模视觉识别挑战）2015年图像分类任务中获得一等奖（Thenmozhi，Srinivasulu&Reddy，2019）。在ResNet中，梯度问题的退化在更深的模型中解决。ResNet通过残差映射在层中引入跳过连接。让X表示这些层中的第一层的输入，h（X）表示要由几个堆叠层拟合的底层映射。如图1所示，映射由f（X）h（X）-X修改为F（X）x，其假设不是优化原始映射，而是更容易优化残差映射。ResNet已经证明，它可以通过简单地将多个非线性层的权重向零驱动以接近恒等映射来解决退化问题（Xiao，Li，Wang，Lin Wang，2017&）。ResNet-18如图2所示，ResNet-18由18层组成，其中架构可以表示为4个残差块的组合。在每一层中，都有3个滤波器，并在进一步的层中进行下采样。ResNet-18给出了准确的结果，但它收敛得更快，错误率更高。ResNet-18比18层网络更好，在人员重新识别任务中表现良好。网络中的SoftMax层在ImageNet中训练后被替换，因为它不应该重叠。在这里，遵循该网络中的两步微调Fig. 1. 残余连接。A. Gupta等人智能系统与应用16（2022）2001374×∑=+×× ×××ResNet 34图2. ResNet-18使用带有微调的迁移学习架构。ResNeXt-50 32×4dResNet-34包含34层，其中有四个残差块，卷积层，提取特征;最大池化层目标是对输入表示、平均池化层、完全连接和SoftMax层进行下采样，如图3所示。该网络也由3个滤波器组成，分为3层、4层、6层和3层。 ResNet-34的性能优于ResNet-18，表现出更低的训练误差和更好的泛化能力。ResNet-18和ResNet-34主要用于在我们的迁移学习研究中也是如此。这里两步微调在该网络是受VGG网络启发的ResNet- 50的修改版本，如图5所示。在该网络中，形成残差块的堆栈，其遵循两个规则：- a）如果它们产生相同大小的空间图，则块共享相同的超参数，以及b）当空间图以因子2下采样时，块的宽度乘以因子2。在这个网络中，引入了一个新的维度，基数。这个网络被跟踪。y xCi=1Ti（x）（1）ResNet 50顾名思义，这个网络由四个残差块组成，有50层，如图4所示。该网络用三层块取代了ResNet-34中的两个过滤器块。在这个网络中使用的过滤器遵循瓶颈技术：首先，有一个1 1过滤器，然后是33后面跟着11过滤器，其中11层负责减少和恢复，使3 3层成为输入/输出维度较小的瓶颈。在这里，在这个网络中的两步微调。在上面的等式1中，C是基数，即要聚合的变换集的大小（Hu，Shen，Sun，2018&）。上面的等式表示聚合转换，其中c控制修改。实验表明，基数比传统的深度和宽度更有效。在上面的等式中，变换的聚合充当残差连接;整个y是输出。在这里，遵循该网络中的两步微调图三. ResNet-34使用带有微调的迁移学习架构。A. Gupta等人智能系统与应用16（2022）2001375∑n见图4。 ResNet-50使用带有微调的迁移学习架构。损失函数图五、ResNeXt-50使用带有微调的迁移学习架构。数据集和设置SoftMax损失被广泛应用于计算机视觉的各个领域。SoftMax函数有助于更好地学习模型，并可以轻松找到数据中的等式2解释了SoftMax损耗的工作原理WT为了进行实验，使用了ImageNet（Deng，Dong，Socher，Li，Li，&Fei-Fei，2010）和Market 1501（Zheng，Shen，Tian，Wang，WangTian，&2015）数据集。在ImageNet上预训练模型。ImageNet数据集由1000张图像组成，这些图像说明了同义词集，如1∑eyix iby iWordNet层次结构。ImageNet的图像用于预训练LCE=-N日志WTxi+bj（2）j=1ej在等式2中，yi是在i处的训练样本的类别标签;xi是在I处的训练样本，N表示标签的数量，W是权重矩阵X，偏差由b表示结果和讨论在这项研究中，市场1501数据集的人re-id的实验已经进行。在这项研究中，提出了一种基于迁移学习的ResNet模型，该模型在ImageNet上进行了预训练，然后进行了微调，性能优于有监督的域自适应模型。以下小节描述了数据集的详细信息和所提出的方法所取得的结果。因为这是一个很大的数据集;正如在引言部分所解释的那样因此，需要更大的训练数据集来进行训练，这有助于更好的训练。ImageNet上的预训练解决了不存在带注释的高质量图像来训练模型的问题。Market-1501数据集（如图6所示）用于我们实验中的进一步训练和测试。该数据集是从放置在清华大学超市的6台相机（1台低分辨率相机和6台高分辨率相机）收集的。在不同相机中存在视场重叠。该数据集包含32，668个注释的1，501个身份。表1提供了有关数据集的更多详细信息。监督迁移学习方法用于751个身份的训练和画廊训练设置，包括12936和15913A. Gupta等人智能系统与应用16（2022）2001376××联系我们见图6。市场-1501样品表. 1Market 1501数据集Dataset Market-1501#身份1，501#BBoxes32，668#distractor2，793#凸轮。根据ID6手/手评价图图像，同时使用750个身份进行查询，其包括3368个图像，全部从6个相机收集。此外，对所有模型使用相同的列车、图库和查询设置。评估指标秩-1，5，10和20被用来评估人re-id方法的性能。Rank-1是检查预测标签与地面标签相同次数的百分比。如果有许多类，则计算秩5和更高的秩。就像Rank-5确定地面真值标签是否在前5个最可能的标签中，10和20也是如此。按照（Zheng，Shen，Tian，Wang，Wang Tian，2015&）的建议评价平均精密度（mAP），以评价Market-1501。结果在大型数据集person re-id数据集，即Market 1501上，对ResNet的变体使用两步微调。我们的模型的结果如表2所示，与最先进的监督训练模型的比较如表3所示。表中的TransLearn代表迁移学习，FT代表微调。如表1所示，ResNeXt-50_32 4d通过迁移学习实现了最高的mAP得分和rank-1，并且微调已经超过了所有现有模型。得出以下结论通过迁移学习和微调训练的模型：（1）我们的两个模型，ResNet-18 translearn+ FT和ResNet-34 TransLearn表2Market-1501数据集表3在Market-1501数据集监督下与现有模型的性能评估比较CNN+ PV（陈，王，石，严，耿，田翔，2018&）81.5 63.1CNN+ TL（陈，王，石，严，耿，田翔，2018&）72.4 49.7STNET（Wang，Hu Zhang，2020&）73.5 48.2STNET（Wang，Hu Zhang，2020&）74.6 49.7MSTNet-piX el（Wang，Hu Zhang，2020&）75.8 50.4MSTNet-task（Wang，Hu Zhang，2020&）76.2 51.1MSTNet（Wang，Hu Zhang，2020&）80.9 55.2OGNet（Zheng，Zheng Yang，2020&）87.71 69.52我们的96.0 68.4+FT，表现相当相似（2）当你对模型的性能评估变得更加宽松时，所有模型都从表3中可以得出以下观察结果：-（1）我们的模型显著优于最先进的Market 1501数据集，在rank-1中的差距为12.4%，在mAP中的差距为5.3%，这已被证明是我们四个模型中表现最好的模型（ResNeXt-50_324d）。(2)所有基于深度学习的模型都比非深度学习模型表现得更好，因为手工制作的基于特征的模型具有优势。我们的模型表现优于现有模型，因为我们从更大的数据集ImageNet中学习了特征表示并进行了微调。我们的模型优于基于深度网络的模型（Chen，Wang，参数ResNet-18转 TransLearnResNet-34转 TransLearnResNet-50转 TransLearn转换器ResNeXt-50_32£ 4d超声波 TransLearn超声波地图分数65.6066.2067.7068.40秩-184.3083.6084.5096秩-593.3093.109493.50十阶95.6095.709695.50二十阶97.4097.409797.10模型秩-1地图XQDA（Liao，Hu，Zhu，Li，2015&）54.128.4SCSP（廖，胡，朱，李，2015&）--DNS（Zhang，Xiang，Gong，2016&）71.546.0Siamese LSTM（Varior，Shuai，Lu，Xu，Wang，2016&）61.635.3门控S-CNN（Varior，Haloi，Wang，2016&）76.048.4CAN（Liu，Feng，Qi，Jiang Yan，2017&）--GAN（Zheng等人， 2017年）83.9766.07重新排名（钟，曾，曹丽，2017&）77.1163.63CNN+ SID（陈，王，石，严，耿，田翔，2018&）83.662.2A. Gupta等人智能系统与应用16（2022）2001377××+++++产品介绍×Shi ， Yan ， Geng ， Tian Xiang ， 2018& ）和（ Wang ， Hu Zhang ，2020&）主要是因为ImageNet更好的特征表示。在这项研究中，所有的模型只有一个单一的损失被认为是。下面的图7显示了当使用迁移学习进行训练并进行微调时，ResNet随深度的不同变化的分类精度。图8表明，具有聚集变换的ResNet的最深变体创建了更好的网络连接和特征学习连接。图7以图形形式示出了关于mAP和秩1的结果的比较。比较是与现有的和相关的研究。从图8可以得出模型的总体性能。该图显示，在rank-10之后，所有模型的表现都相似。这表明ResNeXt-50_32 4d在大多数情况下表现良好。图9中的曲线图显示了图中所有模型的秩度量的变化;可以看到秩-1，并且所有曲线图都给出了近似相同的结果，这证明了模型的深入并不总是会导致更好的结果时代的影响基于在哪个时期的数量中实现的最佳精度来决定时期的数量。所有模型都在40个epoch上进行了训练。从10个epoch开始训练我们的模型，然后将epoch增加到40，在ResNeXt-50_32 4d TransLearn FT模型中达到最高mAP得分68.40%，在ResNet-50 TransLearn中达到67.70%FT模型，ResNet-34中为66.20%TransLearnFT模型和ResNet-18 TransLearn FT模型中从图从图10和图11中可以看出，mAP得分随时间的变化表明ResNet-18、ResNet-34和ResNet-50开始时性能较低，后来获得了更好的mAP得分。在图12中，示出了等级的变化，示出了分数，其示出了在40的时期处实现最高的准确度，其中除了ResNeXt之外的所有模型的等级。50_32 4d从低到高变化，而另一个模型中没有显著变化。图12和13显示了在迁移学习和微调上训练的不同模型中的时期变化。这种变化表明，在某些时期之后，所有模型的表现都相似。与其他现有模型相比，Market 1501数据集在40个时期的最高准确率为96.0，并且我们的模型已经超越了所有现有模型。可视化结果，以了解迁移学习和微调的贡献以及模型如何随培训而变化。该网络的总体分类性能是监督学习中任何网络所达到的最高准确率，Rank-1得分为96.0%，与现有网络的差距为12.4%，而mAP得分为68.4%，差距为5.3%。最好的性能指标是ResNeXt-50_32 4d通过迁移学习和微调实现的。这项研究对18到50层的不同模型进行了实验，结果表明，较深的模型并不总是比较浅的模型表现得更好。该模型的性能优于任何现有的模型，因为从更大的数据集和微调的特征表示学习。这种对ImageNet和Market1501的特征的详细学习必须导致模型的更好性能，证明网络更好地了解视觉特征。这种对特征的更好的认识是所提出的模型的性能的关键贡献这项研究提出了通过迁移学习在各种配置中进行深度残差网络训练，测试和预训练模型，还进行了微调。这些模型之前在ImageNet（一个更大的数据集）上进行了训练，以更有效地理解视觉特征在没有大量源数据的情况下，我们提出了一种可靠有效的多度量假设迁移学习方法，以有效地使新引入的摄像机适应现有的人re-id框架。为了证明我们建议的策略优于当前的选项，我们在一些基准数据集上进行了严格的测试。我们考虑了基准数据集，这些数据集可以在没有地理边界的情况下获得结果。结论该研究提出了一种基于迁移学习的模型，该模型的性能优于现有模型，并已被证明有助于解决较大标记数据集的可用性问题。这些模型经过微调，以达到更高的准确性。我们的研究表明，如果模型与迁移学习和微调技术相结合，它们将在人员重新分类问题中表现得更好见图7。分类结果比较。···A. Gupta等人智能系统与应用16（2022）2001378++图8.第八条。在分类精度不同的情况下提出了迁移学习和微调。图9.第九条。采用迁移学习和微调的不同拟议模型的整体性能。图10个。 mAP评分随时间的变化。识别.实验结果还显示了历元对性能的影响。这项研究对ResNet的18层到50层的变体进行了实验，因为更深的层次会导致更多的时间复杂度，而不是更好的结果，这是通过更好地训练这些较浅的模型无法实现的。此外，将这些模型与基于深度网络和其他技术的现有模型进行了比较。结果表明，我们提出的ResNeXt TransLearn Ft模型的性能达到了最高mAP得分68.4%，提高了5. 3%，排名1的96.0%，提高了12.4%，这是监督设置中Market 1501数据集的建议评估指标。在未来，我们的工作将更多地集中在实时应用和使其无监督。该模型A. Gupta等人智能系统与应用16（2022）2001379图11. mAP评分的变化。图12. Rank评分随时间的变化。图13岁排名分数的变化。将有助于在没有大型训练数据集时更好地分类人的re-id问题。我们的研究结果表明，这种策略也提供了有竞争力的性能，并可以提供re-id特定的领域知识和见解，以指导未来的研究。将来，个人身份证可以用于公共场所的安全管理和寻找失踪人员或儿童。我们对学习更强大结构的障碍和潜力进行了深入的讨论。竞争利益作者声明，他们没有已知的可能影响本文所报告工作数据可用性数据将根据要求提供A. Gupta等人智能系统与应用16（2022）20013710引用Ahmed，E.，琼斯，M.，&马克斯，T。K.（2015年）。一种改进的深度学习架构，用于人员重新识别。在IEEE计算机协会计算机视觉和模式识别会议论文集，2015年6月7日至12日（pp. 3908-3916）。https：doi.org/10.1109/CVPR.2015.7299016Ahmed，S. M.，Lejbolle，A. R.，潘达河，&Roy-Chowdhury，A. K.（2020年）。使用假设迁移学习进行人员重新识别的摄像机加载。IEEE/CVF计算机视觉与模式识别会议论文集（Proceedings of the IEEE/CVF Conference on Computer Vision and PatternRecognition）12144-12153）。https://doi.org/10.1109/CVPR42600.2020.01216Bai，X.，杨，M.，Huang，T.，Dou，Z.，Yu，R.，&Xu，Y.（2020年）。Deep-Person ：学习用于人员重新识别的有区别的深度特征。 98. 第一次约会https://doi.org/10.1016/j.patcog.2019.107036Bedagkar-Gala，A.，&沙阿，S。K.（2014年）。个人重新认同的方法和趋势的调查。Image and Vision Computing，32（4），270-286.https://doi.org/10.1016/j.imavis.2014.02.001陈洪，王玉，Shi，Y.，Yan，K.，Geng，M.，田，Y.，&Xiang，T.（2018年）。深度迁移学习用于人员重新识别。2018年IEEE第四届多媒体大数据国际会议，BigMM2018。https://doi.org/10.1109/BigMM.2018.8499067陈伟，陈旭，张杰，&Huang，K.（2017年）。Beyond Trip Loss：A Deep QuadripletNetwork for Person Re-identification.论文集-第30届IEEE计算机视觉和模式识别会议，CVPR 2017，2017年1月（pp. 1320-1329）。https://doi.org/10.1109/CVPR.2017.145Gray，D.，&Tao，H.（2008年）。Viewpoint Invariant Pedestrian Recognition with anEncourage of Localized Features- ECCV 2008.第5302次会议（2008年10月）。https://doi.org/ 10.1007/978-3-540-88682-2.Grigorev，A.，Tian，Z.，Rho，S.，Xiong，J.，Liu，S.，&Jiang，F.（2019年）。无人机图像中的深度人物再识别Eurasip Journal on Advances in SignalProcessing，（1），2019。https://doi.org/10.1186/s13634-019-0647-z他，K.，张，X.，Ren，S.，&Sun，J.（2016）.深度残差学习用于图像识别。在IEEE计算机协会计算机视觉和模式识别会议论文集，2016年12月（pp. 770-778）。https://doi.org/10.1109/CVPR.2

下载后可阅读完整内容，剩余1页未读，立即下载