深度学习优化Mask R-CNN:齿轮微小缺陷检测新方法

需积分: 50 16 下载量 139 浏览量 更新于2024-08-13 3 收藏 1.39MB PDF 举报
"这篇研究论文主要探讨了基于深度学习的齿轮视觉微小缺陷检测方法,采用了Mask R-CNN网络,并进行了针对性的优化。通过对比不同残差神经网络,选取resnet-101作为图像特征提取的基础。进一步优化中,去除了特征金字塔网络中对于P5特征图的不合理3x3卷积操作,提高了缺齿检测的准确性。同时,通过设计特定的样本标注方案和调整anchors的大小与宽高比,提升了候选区域网络的训练效果。最终,经过优化的Mask R-CNN网络在齿轮缺齿检测上的检出率达到了98.2%。" 文章深入探讨了深度学习在解决精密机械部件,特别是齿轮的微小缺陷检测问题的应用。Mask R-CNN是一种用于实例分割的深度学习模型,它可以同时进行目标检测和像素级分类,非常适合处理这类需要精细识别的任务。在这个研究中,研究者比较了包括resnet-101在内的五种不同的残差神经网络,发现resnet-101在图像特征提取上表现最优,因此被选作基础网络结构。 接着,研究者注意到了特征金字塔网络(Feature Pyramid Network, FPN)中的一个问题,即在P5层进行的3x3卷积可能导致对微小缺陷的识别能力下降。通过移除这一操作,他们观察到缺齿检出率有所提升,这表明这一调整有助于提高模型对细节的敏感度。 此外,为了更有效地训练候选区域网络(Region Proposal Network, RPN),研究团队设计了一套特定的样本标注方案,考虑到了小范围尺寸变化的影响。通过调整anchors的大小和宽高比,使得模型能够更好地适应不同尺寸的缺陷,从而提升了整体的检测性能。 该研究不仅展示了深度学习在解决工业检测难题中的潜力,还提供了一个具体的、优化过的Mask R-CNN模型,为今后在类似领域的应用提供了参考。98.2%的缺齿检出率证明了这种方法的有效性,对提高齿轮制造质量控制和自动化检测水平具有重要意义。