没有合适的资源?快使用搜索试试~ 我知道了~
可持续运营和计算机2(2021)235应用深度学习和机器学习模型检测COVID-19口罩-综述Elliot Mbungea,b,Mr.,Sakhile Simelanea,Stephen G Fashotoa,Boluwaji Akinnuwesia,Andile S Metfulaaa斯威士兰大学科学与工程学院计算机科学系,P Bag 4 Kwaluseni,斯威士兰b南非德班科技大学会计和信息学院信息技术系,邮政信箱1334,德班4000aRT i cL e i nf o保留字:COVID-19面罩人工智能深度学习模型机器学习a b sTR a cTCOVID-19疫情的持续高涨和新出现的变种给许多卫生系统带来了前所未有的挑战。许多监管机构已强制使用口罩,特别是在人们频繁和不可避免地大量接触的公共场所,特别是在公共交通设施,体育场,购物中心和工作场所内。然而,由于各种原因,包括不同的口罩类型、不同程度的障碍、各种变化、平衡各种模型检测准确性或误差和部署要求、视角、在处理能力有限的计算机上部署检测模型、低分辨率图像、面部表情和缺乏真实世界数据集,因此遵守和坚持正确佩戴口罩一直很困难。因此,本研究旨在对用于检测口罩的人工智能模型进行全面审查。该研究显示,Inceptionv3卷积神经网络等深度学习模型在检测COVID方面的准确率达到99.9%。19面具我们推断,大多数用于检测口罩的数据集都是人为创建的,并不代表真实世界的环境,这最终会影响模型在现实世界中部署时的精度因此,需要共享真实世界的COVID-19面罩图像,以用于对深度学习技术进行建模。该研究还显示,具有更多训练参数的更深更广的深度学习架构,如inception-v4、Mask R-CNN、Faster R-CNN、YOLOv 3、Xception和DenseNet,尚未实现用于检测口罩。1. 介绍新型冠状病毒(COVID-19)的紧急情况给全球许多卫生系统带来了前所未有的挑战。2020年3月,世界卫生组织(世卫组织)宣布进入突发公共卫生事件。 随着流行病继续蔓延,特别是在易受感染的国家,人口不断减少[1]。COVID-19疫情持续上升及新出现的变种导致各国加强感染及预防措施,例如对疑似及阳性病例实施旅行限制、全国封锁、隔离及检疫、定期洗手及体温检查、佩戴口罩及保持社交距离等卫生措施,以对抗疫情。此外,一些国家宣布了COVID-19限制措施,如全国封锁、宵禁、旅行限制、关闭公共场所、物理距离和关闭边境[2]。这些限制给发展中国家带来了严峻的挑战,这些国家的基础设施薄弱、卫生系统不堪重负、资金不足和公共卫生监督有限,损害了它们的潜在经济效益[2]。大规模的限制-这些措施不容易实施、遵守,随后难以实践和维护,导致公众不完全遵守,特别是如果对社会和政治规范、经济[3]以及受影响人口的心理健康产生重大影响。显然,在疫苗成功开发之后,注意力现在转向人群的疫苗接种[4]。然而,新出现的COVID-19变种、漏洞百出的边境、非正规贸易商的定期流动和出售假疫苗接种证书继续威胁着一些国家在遏制病毒方面取得的进展值得注意的是,呼吸防护设备如面罩提供了针对感染的个人防护。口罩是合理的,更容易使用,尽管正在进行的研究,来测试他们的效率目前,尽管成功开发了疫苗,但佩戴口罩仍然是减少传播链的首要措施[5-监管机构已强制使用口罩,特别是在人们频繁且不可避免地大量接触的公共场所,特别是在公共交通设施,体育场,购物中心和工作场所[8]。∗ 通讯作者。电子邮件地址:mbungeelliot@gmail.com(E. Mbunge)。https://doi.org/10.1016/j.susoc.2021.08.001接收日期:2021年3月9日;接收日期:2021年6月24日;接受日期:2021年8月23日2021年8月28日网上发售2666-4127/© 2021作者。由Elsevier B.V.代表KeAi Communications Co.出版,这是一篇CC BY-NC-ND许可证下的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)可在ScienceDirect上获得目录列表可持续运营和计算机期刊主页:http://www.keaipublishing.com/en/journals/sustainable-operations-and-computers/E. Mbunge,S. Simelane,S.G. Fashoto等人可持续运营和计算机2(2021)235236此举是为了避免在新常态下各国重新开放时COVID-19再次感染和持续传播。美国、南非、法国、巴西、印度、中国、肯尼亚、乌兹别克斯坦、黎巴嫩、西班牙和卡塔尔等国家已经实施了口罩指导方针,以及对违反口罩指导方针的处罚[9]。执法人员和社会团体的任务是监测和观察人们遵守和遵守口罩指导方针的情况。如果佩戴得当,口罩可以减少咳嗽飞沫 然而,由于一些原因,包括使呼吸困难的潜在健康状况[13]、卫生条件差、非正规住区[14]、社会动荡、社会经济因素[15]、无知和缺乏口罩等,遵守和坚持佩戴口罩一直很困难[11,12]。值得注意的是,新兴技术已应用于不同领域以应对COVID-19。这些技术包括物联网、区块链[16]、5G技术、地理信息系统、大数据和人工智能(AI)。例如,科学家、研究人员和技术人员已采用人工智能模型来扩大流行病筛查过程、热点和迁移模式的检测和实时绘图、热成像、预测、建模、筛查、监测和诊断COVID-19疑似病例[14,17自疫情爆发以来,人工智能技术也被用于开发接触者追踪应用程序、社交距离工具、智能可穿戴设备,以及随后远程监控隔离和检疫设施中的患者[20]。例如,[8]对应用于检测COVID-19的机器学习和深度学习技术进行了系统性审查。19. 此外,[21]对人工智能模型进行了快速审查,应用于COVID-19筛查、筛查和诊断的临床护理参考文献[22]对深度学习用于covid-19预后进行了系统综述已发表的评论均未分析用于检测COVID-19口罩的人工智能2. 研究报告的贡献由于缺乏基于技术的口罩监测工具以及合规和遵守政策,第三和第四波是不可避免的。此外,面罩检测一直是一项艰巨的任务,特别是在图像处理中,因为面罩类型多样,摄像机像素多样,障碍程度不同,各种变化(例如视角,照明,分辨率和旋转)[23],平衡各种模型检测精度或误差以及实时要求[24],在处理能力有限的计算机上部署检测模型,以及管理图像数据库所需的存储空间。在大流行的背景下,口罩检测尚未得到很好的探索,但必须在静态图像、视频以及闭路电视(CCTV)中识别蒙面面孔,以减少病毒的二次传播[24]。一些已发表的关于人工智能模型应用于检测面罩的研究证明了这一点。由于人工智能技术的进步,应用人工智能模型检测COVID-19口罩至关重要。人工智能模型在图像分类和目标检测方面取得了可喜的成果[23]。因此,需要将这些模型应用于检测人脸面具。因此,本研究旨在全面检讨用于检测口罩的人工智能技术,以确保合规及遵守COVID-19口罩。本文的主要贡献如下:1 识别及系统地检讨应用于检测COVID-19口罩的最先进人工智能(深度学习及机器学习)模型。2 确定和讨论用于检测口罩的AI模型的预测精度和局限性。3 探索用于预测口罩的COVID-19口罩图像数据集。4 基于这些发现,该研究为进一步开发有效和可靠的人工智能模型以在真实环境中检测口罩提出了未来的研究方向。然而,下一节解释了进行研究所使用的方法。 第3节介绍了研究结果。 在本节中,结果呈现为:(i)应用于检测面罩的深度学习技术,(ii)用于检测COVID-19面罩的机器学习模型,(iii)COVID-19面罩图像数据集。最后,第四给出了未来工作的结论。3. 方法该研究采用了系统的文献综述,以实现综合用于检测口罩的人工智能模型的文献的主要研究目标。该综述按照Kitchenham指南[25]指导的系统性综述和荟萃分析(PRISMA)模型[22]第一阶段是定义综述的研究问题,然后是定义检索策略、研究选择,最后是研究资格标准和质量评估。因此,本综述旨在解决以下研究问题(RQ):RQ1:有哪些人工智能模型被用于检测口罩,以及它们各自的局限性和检测准确性?RQ 2:使用了哪些COVID-19口罩图像数据集来源?3.1. 搜索策略在进行文献检索之前,明确定义了研究问题。在此之后,在线电子数 据 库 , 如 Scopus , Science Direct , Google Scholar , IEEE XploreDigital Library,Wiley Li-2010,Web of Science和Springer Link进行了探索。文献检索由以下布尔检索字符串指导:((3.2. 资料选择从电子数据库中共检索到1,160篇文章,如图1所示。我们选取了2019冠状病毒病爆发前至2021年6月24日期间发表的同行评审文章。文章的全文必须可用,并以英文撰写。不完整的文章、观点文章、非同行评审的文章以及没有英文翻译的文章从研究中排除。为了确保所有相关文献均纳入本研究,作者对检索到的每篇文献进行了引文链分析。从样本池中取出重复样本(见图1)。对其余文章进行进一步筛选,在标题上。排除的文章不符合上述纳入标准。3.3. 资格标准和质量评估在选择相关文章后,作者进一步独立评估了文章我们进一步评估了全文文章的合格性,删除了45篇文章本研究仅考虑了32篇文章研究设计主要包括应用于检测口罩的人工智能模型和使用AI模型开发的检测口罩的系统。 报告已发表文章数量的步骤见图1中的PRISMA流程图。1.一、科恩E. Mbunge,S. Simelane,S.G. Fashoto等人可持续运营和计算机2(2021)235237Fig. 1. PRISMA流程图。采用Kappa统计量衡量质量评价指标的信度。性评价[26],Cohen's k值为0.50132,作者一致率为78.4%。进行了独立审查,以解决作者之间的分歧4. 结果从所选文章中提取并合成了所有相关数据,以回答研究问题。人工智能模型的结果如表1所示。此外,从表1中,我们计算了基于出版年份的文章数量,如图2所示。这表明,截至2021年6月24日,大多数基于人工智能的口罩检测模型都是在2021年发布的我们希望有关使用人工智能模型检测COVID-19口罩的文章数量将会增加。我们识别了用于检测口罩的深度学习模型。现有文献反映,人工智能技术在检测COVID-19口罩方面取得了可喜的成果。对这些模型及其检测精度作了进一步的说明下面4.1. 深度学习技术在人脸检测中的深度学习是人工智能的一个子集。AI涉及七个方面- 模仿人类认知功能[53]和智能行为[54]的一般技术。机器学习(ML)作为人工智能严重依赖代表性特征和训练算法来从数据集中学习和发现知识。然而,与深度学习(DL)模型相比,ML模型在解决非结构化或复杂问题时由于其约束而解决了约束良好的问题[55]。DL模型利用许多表示层,通过从生物神经元中汲取灵感来发现数据中的多方面和内在关系[17]。深度学习技术能够从非结构化或未标记的数据集中获得有意义的见解[55],从而彻底改变机器学习领域。通过数据集中的深层层次特征构建。它有时被称为深度神经网络(DNN)。DL由多层神经网络组成;一个或多个隐藏层连接形成一个网络,能够学习具有高抽象级别的复杂结构[56]。DL模型已成功应用于不同领域,如目标检测和图像分类[57]。在其他深度学习模型中,卷积神经网络(CNN),ResNet-50,You Only Look Once(YOLO)版本(YOLOv 1,YOLOv 2和YOLOv 3),基于区域的卷积神经网络(R-CNN),移动网络(MobileNet v1和MobileNetv 2)和Inceptionv3在检测面部标记方面取得了令人满意的结果,如表1所示。4.1.1. 基于卷积神经网络的人脸检测CNN是一种深度神经前馈网络,其工作原理是权重共享,空间特征提取能力和更少的计算成本[39]。CNN架构最初由LeCun于1989年引入,旨在处理视觉图像[58]。最近CNN架构在检测对象方面的改进已经看到了几种基于CNN的模型在检测面罩方面的出色性能基于CNN的模型采用人工神经网络(ANN)的架构。它可以被认为是一个分类器,用于提取和处理图像数据的分层特征该网络通常使用激活函数和训练算法来自适应地学习图像特征的空间层次[59]。因此,图像作为输入标签给出,并且自动完成在CNN中,第一层是输入图像。CNN不是只有输入层和输出层,而是有更多额外类型的层或构建块,称为卷积层,池化层和全连接层[60]。卷积层是CNN的核心模块,负责将输入图像与可学习的滤波器进行卷积并提取其特征。每个滤波器都由检测层输入特征的神经元组成。卷积学习图像特征,并通过使用输入数据的小平方输入图像被任何过滤器滑过E. Mbunge,S. Simelane,S.G. Fashoto等人可持续运营和计算机2(2021)235238表1人工智能模型应用于检测COVID-19口罩。分类网络(SRCNet)[27]。混合深度迁移学习模型[28]。Inceptionv3卷积神经网络[29].使用图像超分辨率和分类网络区分有面具和没有面具的面孔。混合模型由支持向量机、决策树和集成方法组成,用于检测面具。Inceptionv3是Googlenet的一个模块,有22层深度以提高准确性。Inceptionv3卷积神经网络可以检测到没有戴口罩的人。精度混合模型的测试准确率达到99.64%。该模型达到了99.9%的准确率。SRCNet模型相对较小。戴口罩的条件识别不能满足不同的姿势和动态环境。该模型使用来自真实世界面具人脸数据集的图像,该数据集由5000张面具人脸和90,000张未面具人脸组成。该研究不包括真实视频流中的人脸检测。该研究在一个小的图像数据集上测试了Inceptionv3。Inceptionv3可以使用大型数据集进行重新测试,并在实时视频流中进行进一步测试。数据库公开。该研究使用了三个数据集,分别是真实世界的蒙面人脸数据集(RMFD)、模拟蒙面人脸数据集(SMFD)和野外标记人脸数据集。该研究使用了模拟面具面部数据集。轻量级神经网络[30]。神经网络应用MobileNetV2 和 Single ShotDetector(SSD)用于检测面罩。Facemasknet模型[31].COVID-19口罩检测器,Facemasknet使用深度学习模型来确定三种情况:(a)面具脸(b)正确面具脸和(c)非面具脸。深度学习模型[32]。该模型经过训练,闭路电视(CCTV)摄像机监控的公共场所戴口罩和不戴口罩的人的照片。神经网络的准确率达到85%。该模型达到了98.6%的准确率。深度学习模型达到了98.7%的准确率。在实时视频监控中,使用大数据集需要提高模型的准确性。Facemasknet模型仅限于使用图像进行人脸面具检测。该模型仅使用闭路电视(CCTV)摄像机检测蒙面面孔和非蒙面面孔。没有记录实时视频流。所提出的系统使用一个自定义数据集,该数据集由具有不同类型的面罩的人脸图像组成,这些面罩被标记并用于训练模型。该数据集由3165张图像组成。该模型使用了来自蒙面人脸检测数据集(MFDD),真实世界人脸识别数据集(RWFCD)和模拟蒙面人脸识别数据集(SMFRD)的数据集。未提及数据集来源。基于多尺度面具检测和分类的实时深度迁移学习模型[33]。该模型集成了FMY3、YOLov3和Resnet_SSD300算法来检测人脸。深度迁移学习模型达到了98%的准确率。使用的数据集非常小。数据集源不是人所提及然而,模型分别用680和1400张图像进行训练。R-CNN模型用于检测面罩[34]。集成的YOLO-v2和ResNet-50深度学习模型[35]。使用单次拍摄多波检测器和MobileNetV 2的基于DNN的实时面罩检测系统[24]。深度学习模型从视频片段中检测掩码[36]。一个新的深度学习模型[37]。R-CNN模型使用TensorFlowObject Detection API来检测非遮罩和遮罩人脸。使用SSDMobileNet V2模型和SSDInception V2模型与R-CNN模型进行比较,以确定其效率。该模型应用ResNet-50提取特征,然后应用YOLOv 2检测医用口罩。该模型使用Single Shot MultiboXDetector和MobilenetV2深度学习、TensorFlow、Keras和OpenCV来检测口罩。该模型使用MTCNN人脸检测模型检测人脸掩码来识别人脸,并使用一个利用MobileNetV2架构的分类器来检测掩码区域中的对象。CNN模型识别没有戴口罩的人,并收集他们的详细信息以进行进一步的惩罚。提出的R-CNN模型实现了68.72%的检测准确率。一个新的深度学习模型达到了81%的准确率。该系统的检测准确率达到93%。人脸检测准确率为81.84%,预测率为81.74%。深度学习的准确率达到91.21%。该模型面临一个过度拟合的问题。R-CNN模型没有部署在现实环境中以实时检测掩码。它还可以检测脸上的任何口罩作为医用口罩。ResNet-50消耗大量的计算内存,但它提供了良好的检测精度。该模型的性能严重依赖于人脸检测模型。因此,如果MTCNN错误地检测到人脸,那么MobileNetV2将无法检测到对象。该模型无法检测到戴面具的人。该模型使用COCO数据集进行训练。该模型使用来自医用口罩数据集和面罩数据集的数据集。该模型使用了PyImageSearch上提供的Kaggle医学掩模数据集和开放数据集的组合数据集。该模型使用了在公共场所拍摄的视频片段。未提及数据集来源。(接下页)AI模型型号说明精度限制图像数据集源超分辨率和模型自动该模型实现了98.70%用于测试的数据集模特使用CelebA面膜E. Mbunge,S. Simelane,S.G. Fashoto等人表1(续)可持续运营和计算机2(2021)235239面具人脸检测[38].RETINAFACEMASK:面罩检测器[39]。面具使用MobilenetV2和深度学习,该模型将识别该人是否戴口罩。RetinaFaceMask采用了RetinaNet、特征金字塔网络和Single Shot MultiBoX的架构来检测人脸面具。MobileNet和ResNet模型用于测量RetinaFaceMask模型的性能。specified.采用MobileNet的RetinaFaceMask模型实现了83.0%的检测准确率RetinaFaceMask模型与ResNet的成功率分别为91.9%和91.9%。使用FACE数据集未发现任何局限性。该研究使用图像数据集从Face Mask Dataset,WiderFace和MAFA数据集。基于YOLOv 3深度学习的COVID-19口罩分类系统[40]。深度学习模型集成了YOLO-v2和ResNet-50来检测口罩[35]。YOLOv3深度学习模型与Google在基于深度学习的辅助系统中实现了co-laboratory该模型由用于特征提取的ResNet-50和用于检测COVID-19医用口罩的YOLOv 2组成。该模型达到了96%的检测准确率。该模型实现了81%的检测准确率。YOLOv3深度学习模型使用了有限的数据集,虽然取得了令人鼓舞的结果,但需要用真实世界的数据进行测试。该模型无法检测视频片段中的面罩。此外,该模型使用了来自互联网的人工图像,尚未在真实环境中进行测试。Google联合实验室的数据集由650张图片组成。该模型使用了来自医用口罩数据集和面罩数据集的两个数据集。小CNN架构[41].微型CNN模型是开发用于在不利环境中检测医用面罩,因为它需要低内存占用。该模型使用来自Kaggle和OpenMV Cam H7相机的多个数据集进行训练。[42]第四十二话该模型使用无服务器边缘计算来检测浏览器中的面罩。WearMask可以在连接到互联网的移动设备上工作,因为计算和硬件成本最小化。模型的训练准确率和测试准确率分别达到99.79%和99.81%。WearMask模型实现了89%的检测准确率。未观察到任何局限性。使用大小为200 × 200的图像训练模型,并将其保存在开发板的SD卡上。该数据集有1979张图像,使用增强技术技术.第四个数据集也是使用OpenMV相机生成的,其中594张图像被增强到4794张。这种模式需要互联网连接,因此价格昂贵。在这项研究工作中使用了四个数据集。Kaggle的第一个数据集包含大约11,792张在不同背景下拍摄并裁剪到面部区域的图像。第二个数据集也来自Kaggle,其中有440张在嘈杂背景下拍摄的图像。的第 三 个 数 据 集 由 作 者 使 用OpenMV Cam H7相机生成。从WIDER FACE数据集收集正常面部数据(无掩模)。用于人脸检测的多级CNN架构[43]。基于遗传算法的口罩检测系统蚂蚁-群体优化[44].基于DL的系统检测面罩是否正确佩戴。该系统使用双级CNN架构来检测来自闭路电视摄像机的掩模。人脸检测模型,用于检测图像和视频中的人脸,并从图库中识别人脸。该模型给出了98%的准确率。该模型的准确率为96%。它不能检测面部的侧面视图。它可以集成到COVID-19口罩中。否则,它使用蚁群优化进行人脸检测;它没有使用COVID-19面罩图像进行训练。COVID-19口罩数据集来自Kaggle,其中853张图像属于3个类别。未指定使用的图像数据集。[45]第四十五话.一种检测系统,手机首先,从面具微照片的灰度共生矩阵中提取三个特征利用KNN算法实现了三结果检测。模型精度为82.87%它只适用于智能手机,并不适合所有人。该模型利用灰度共生矩阵从人脸照片中检测出人脸。基于深度学习的无人驾驶方法称为MOXA[23]。MOXA模型支持YOLOv 3、YOLOv 3 Tiny、SSD和FasterR-CNN来检测口罩。YOLOv3实现了63.99%的mAP,YOLOv3 Tiny模型的满意mAP为56.27%,SSD的mAP为46.52%,F-RCNN记录的mAP为60.5%。MOXA模型需要改进,纳入更先进的物体探测模型。该模型使用MoX a3K基准数据集。该数据集由3000张图像组成。该研究还使用了Kaggle(接下页)AI模型型号说明精度限制图像数据集源级联框架,该模型有助于检测准确性不是未发现任何局限性。一个叫做MASKED的E. Mbunge,S. Simelane,S.G. Fashoto等人表1(续)可持续运营和计算机2(2021)235240单次激发多波X射线探测器和MobileNetV2[24]。它集成了一个单次多波X检测器和MobileNetV2深度学习模型作为分类器,以便在嵌入Raspberry pi等设备时执行实时掩码检测。TensorFlow和OpenCV来检测面罩。SSDMNV2模型的检测准确率达到92.64%。模型可部署在移动设备上,由于所需的计算能力较低,该模型使用人工创建的图像进行训练,尚未在真实环境中进行测试,并使用实时CCTV。来自Kaggle的Medical MaskDataset和PyImageSearch的开源数据集。PyImage搜索数据集由1,376张图像组成。YOLO-v2与ResNet-50[35]。研究深入基于YOLO-v2和ResNet-50的医学面具人脸学习。该模型的预测准确率达到81%。该研究没有基于图像和视频的面具,而是检测医学面具。该模型使用来自Kaggle的医用口罩数据集和人脸口罩数据集。卷积神经网络[46]。使用MobileNetV2轻量级CNN进行人脸检测[47]。Yolo-v4模型用于检测医用口罩[48]。使用OpenCV和MobileNetV2的基于CNN的掩码检测系统[49]。卷积神经网络模型[50]。人脸检测的深度学习方法[51]。深度学习迁移学习系统[52]。该模型结合了姿势识别技术和深度学习,仅在图像中的感兴趣区域执行视频分析。该模型采用MobileNetV2轻量级卷积神经网络,该模型使用Yolo-v4,这是非常快速,简单的准备,固体和更稳定比以前的YOLO版本。该系统使用TensorFlow、Keras和OpenCV库等深度学习框架来实时检测口罩。利用CCN模型检测人脸面具该研究应用ResNet-50与特征金字塔网络和多任务卷积神经网络该系统使用VGG-16,MobileNetV 2,Inceptionv3,ResNet-50和CNN进行训练。该模型实现了95.8%的识别准确率。该模型达到了99.98%的高精度。该模型达到了99.98%的准确率。MobileNet模型达到了99%的准确率。该模型达到了96%的检测准确率。该模型达到了87.7%的检测准确率。该系统实现了99.81%的最高精度,同时使用VGG-16和99.6%使用MobileNetV 2该模型是用有限的数据集训练的。MobileNets不像Faster R-CNN和InceptionV 2等其他模型那样准确。该模型需要高计算能力和最低30FPS速率的高分辨率相机。该系统使用有限的开放数据集进行训练和测试,这可能会影响其在实际环境中部署时的性能。该模型是用有限的数据集训练的。训练和测试数据集是一个重大挑战。此外,该模型仍然是一个初步的系统,错误地错过了口罩和检测口罩不存在。该系统使用在线可用的数据集,这些数据集大多具有噪声数据并且是人为创建的,这对于创建实时面罩检测系统可能没有用。该模型使用从实际场景中拍摄的图像进行训练。该模型使用了来自医用口罩数据集和面罩数据集的两个数据集。该模型使用来自宽脸和MAFA。该系统使用Kaggle的Medical MaskDataset和PyImageSearch进行训练COVID-19口罩数据集来自Kaggle,其中853张图像属于3个类别。该研究使用了MicrosoftCommon Objects in Context,CelebFaces AttributesDataset,WIDER FACE和Custom Mask CommunityDataset。该系统使用了来自MAFA、Masked Face-Net和Bing的三个数据集。图二、 根据出版年份的文章分布。AI模型型号说明精度限制图像数据集源SSDMNV2:基于深度学习SSDMNV2模型该模型使用Keras,DL,尽管SSDMNV2该模型是使用E. Mbunge,S. Simelane,S.G. Fashoto等人可持续运营和计算机2(2021)235241图三. 卷积神经网络[61]。以产生特征图。另一个特征图是通过在另一个滤波器上滑动输入图像来产生的。滤波器的数量将决定特征图的数量。为了降低单个特征图的维度并保持关键信息,使用了二次采样(也称为池化)[61]。池化层是在两个连续的卷积层之间周期性地添加的层,以减少来自前一层的冗余表示,因此,它控制过拟合。平均池化和最大池化是卷积神经网络的典型池化操作。当池化特征非常稀疏时,最大池化更适合,而平均池化允许这些网络在每层上作用于不同的频率,同时对图像进行下采样以增加不变性并减少冗余[62]。池化层简单地减少了位于小直角接收场中的前一个卷积层的神经元的数量。因此,特征提取由两层完成,池化层和卷积层(见图3)。子采样可以是不同的类型,平均值,总和,最大值等。对于最大子采样,指定空间邻域(例如2 × 2窗口),然后在该窗口内选择该特征校正图的最大元素。新的特征图将被卷积,并对结果特征执行子采样,直到它完全连接。因此,全连接层负责将提取的特征(从池化和卷积层)映射到最终输出,例如对象检测[39]。如表1所示,几位学者应用了CNN模型,如ResNet-50、YOLO-v2、Inceptionv 3、R-CNN、移动网络(MobileNet)、YoloV 3来检测口罩。这些模型在下文中进一步解释。4.1.1.1. ResNet-50。ResNet-50是一个深度为50层的CNN,用于特征提取[63]。 除其他用途外,该架构在包括图像分类和对象检测在内的各种领域中成功实现。ResNet是Residual Networks的缩写。ResNet的优点是它允许成功地对具有150+层的DNN进行深度训练。在ResNet之前,由于成分消失的问题,非常DNN的训练并不容易[64]。残留物 双网络使用跳过连接的概念来解决问题,一小部分正在消失的成分。这是可能的,因为使用ResNet跳过连接,跳过的连接将导致权重而不是减少到一个小值。在人脸检测中,[43]提出的多级CNN架构使用ResNet通过首先识别人脸来检测人脸,然后为检测到的人脸绘制边界框此外,[35]的一项研究将ResNet-50模型应用于特征提取过程,而YOLOv 2用于检测医用口罩,他们的研究实现了81%的口罩精确检测准确率。4.1.1.2. YOLO版本(YOLOv1、YOLOv2和YOLOv3)。 YOLO是一种基于回归的快速算法,它使用单个卷积网络来检测对象[65]。该模型预测完整图像的类和边界框,而不是选择图像的感兴趣部分[66]。为了预测图像,YOLO不会在输入图像中搜索可能包含对象的感兴趣区域,而是将图像分割成单元格,通常为19 × 19网格[67]。YOLO不会多次遍历图像;它只需要看一次图像就可以检测到所有对象。卷积部分的检测是在整个图片上完成的,只需一眼。这使得在预测图像的背景时错误更少[68]。YOLO有不同的版本,包括YOLOv1,YOLOv2和最新的YOLOv3。YOLOv1.YOLO版本1,也称为YOLOv 1;将对象从回归问题[69]。单个卷积网络同时预测多个边界框和这些框的类概率[65]。YOLOv1通过在24个卷积层上添加4个卷积层和2个全连接层来进行修改以进行检测[69]。然而,YOLOv1使用完全连接的层来回归边界框X,并对边界框X预测施加了强空间约束,使得对小对象进行分组具有挑战性。在应用YOLOv 1检测物体的模型中,报告了一个主要缺点; YOLOv 1缺乏精确的检测精度、对边界框预测的空间约束和定位误差,特别是对于小物体[70]。就COVID-19口罩检测而言,截至2021年6月24日,概无研究应用YOLOv 1,原因可能是定位错误及检测准确度欠佳。YOLOv2. 第一个版本的YOLO的召回率相对较低,因此,第二版YOLO(YOLOv2)的召回和定位得到了改进,同时保持了分类的准确性和速度[69]。YOLOv2是最先进的,在各种检测数据集上比一些对象检测模型更快。它可以通过创建许多新技术(如高分辨率分类器,多尺度训练[71],维度聚类和直接位置预测)来更好地匹配平均平均精度图(MAP),以提高精度检测精度[69]。YOLOv2通过使用批量归一化来防止过度拟合来提高收敛性。关于COVID-19口罩检测,[35]将YOLO-v2与ResNet-50一起应用于检测医用口罩,其中YOLOv 2用于对象检测,ResNet-50用于特征提取。与其他模型相比,该模型的性能最好,并实现了81%的平均精度的基础上亚当opti- mizer。YOLOv3.YOLOv 3具有更好的平均精度(mAP)-在0.5和0.95之间的交集超过联合(IoU)度量,因为它将对象检测视为逻辑回归问题[72]。平均精度是目标检测的性能指标E. Mbunge,S. Simelane,S.G. Fashoto等人可持续运营和计算机2(2021)235242模型[73]。就像YOLOv2一样,YOLOv3使用维度类来生成边界框,YOLOv3是一个单一的网络,客观性和分类的损失需要单独计算,但来自同一个前馈卷积神经网络。它为每个类使用独立的逻辑分类器,而不是常规的softmax层[74]。这样做是为了使分类成为多标签分类。YOLOv2使用Darknet 19作为其骨干特征提取器,而YOLOv 3使用称为DarkNet-53的新网络。在COVID-19口罩检测的背景下,[40]应用YOLOv 3开发了一个对口罩进行分类的系统,该模型实现了96%的检测准确率。在该模型中,使用YOLOv3检测人脸。然而,该模型没有使用足够的数据进行训练和测试,因此在现实环境中无法完全确定检测精度。此外,最近推出了新版本的YOLOv 3,即YOLOv 4,但尚未进行检测COVID-19面罩的测试[75],[76]。4.1.1.3. R-CNN。R-CNN模型利用CNN优良的特征提取能力,在提出区域的基础上进行目标检测 分类技术[69]R-CNN由两个步骤组成:选择性搜索和细化阶段。选择性搜索步骤识别边界框X对象区域候选的数量,然后独立地提取每个区域中的CNN特征[77]。提取这些特征用于分类。第二个是细化阶段,其中每个建议中的图像区域被扭曲到一个固定的大小,然后它被映射到一个4096维的特征向量,该向量被馈送到一个分类器中,也被馈送到一个回归器中,该回归器细化了检测的位置[78]。例如,在COVID-19的背景下,Gathani[34]应用R-CNN在基于学习的系统中对蒙面面孔和非蒙面面孔进行分类。该模型的精密度为68.72%,平均精密度为85.82%。此外,更高版本的R-CNN模型、更快的R-CNN和Mask R-CNN尚未实现检测面罩。然而,[79]提出了一种使用Faster R-CNN的人脸检测模型,其中该模型使用WIDER人脸数据集进行训练,并在FDDB和IJB-A数据集上进行测试。检测结果准确。Faster R-CNN是Fast R-CNN的改进,它将区域建议网络(RPN)添加到Fast R-CNN中以解决区域建议问题[80]。然而,R-CNN模型需要更多的计算资源,如时间,内存,能量,并且由于图像裁剪和扭曲而经历信息丢失[69]。4.1.1.4. 移动网络(MobileNet v1和MobileNetv2)。MobileNets架构使用 深 度可 分 离 卷积 来 构 建轻 量 级DNN , 以 提 高 计 算 能力 [81] 。MobleNet在移动应用程序中的尺寸要小得多,性能更快。由于低延迟和低功耗,它们还用于移动设备和移动应用中的分类和检测。它们的小尺寸使它们成为良好的深度学习模型,并在移动设备中拥有高速计算能力这些模型的缺点是准确性; MobileNets不像其他模型那样准确 , 例 如 Faster R-CNN 和 InceptionV 2[82] 。 [82] 提 出 的 具 有MobileNettv 1对象检测模型的单次拍摄多波X检测器使用MobileNettv1进行对象检测,其可用于COVID-19时代的检测面罩。但是,带有MobileNetv1的SSD未能检测到5个人和1个四旋翼。在另一次测试中,它未能检测到2个四旋翼。MobileNetV2是一种轻量级卷积神经网络,因此需要更少的计算能力,可以轻松嵌入计算机视觉系统和移动设备中4.1.1.5. 初始v3. InceptionV3将卷积分解为更小的卷积,从而减少参数的数量。5 × 5卷积被分成两个3 × 3卷积[83]。Inceptionv3是一个使用迁移学习的预训练模型,它将神经网络的参数权重方面的训练知识转移到新模型。它采用了谷歌开发的48层CNN架构[84].关于COVID-19面罩检测,[29]提出的使用InceptionV 3的迁移学习的模型应用InceptionV 3预训练模型来检测面罩,该模型实现了99.9%的面罩检测准确率然而,最新型号的InceptionV 3、InceptionV 4尚未实现检测COVID-19口罩。4.2. 用于检测COVID-19口罩的机器学习模型机器学习是人工智能的一个子集,它为系统提供了自动学习的能力,而无需显式编程[85]。机器学习可以使用监督学习、无监督学习或混合学习来发现数据集中的模式。监督机器学习算法使用标记信息来预测未来事件。无监督机器学习使用未标记的信息,该算法试图通过在未标记的数据中提取自己的特征和标
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 黑板风格计算机毕业答辩PPT模板下载
- CodeSandbox实现ListView快速创建指南
- Node.js脚本实现WXR文件到Postgres数据库帖子导入
- 清新简约创意三角毕业论文答辩PPT模板
- DISCORD-JS-CRUD:提升 Discord 机器人开发体验
- Node.js v4.3.2版本Linux ARM64平台运行时环境发布
- SQLight:C++11编写的轻量级MySQL客户端
- 计算机专业毕业论文答辩PPT模板
- Wireshark网络抓包工具的使用与数据包解析
- Wild Match Map: JavaScript中实现通配符映射与事件绑定
- 毕业答辩利器:蝶恋花毕业设计PPT模板
- Node.js深度解析:高性能Web服务器与实时应用构建
- 掌握深度图技术:游戏开发中的绚丽应用案例
- Dart语言的HTTP扩展包功能详解
- MoonMaker: 投资组合加固神器,助力$GME投资者登月
- 计算机毕业设计答辩PPT模板下载
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功