改进Mask-RCNN在遥感影像建筑物精确提取中的应用

需积分: 4 21 下载量 43 浏览量 更新于2024-08-13 2 收藏 1.48MB PDF 举报
"基于改进Mask-RCNN的遥感影像建筑物提取" 本文主要探讨了一种针对遥感影像中建筑物提取的创新方法,该方法基于改进的Mask-RCNN模型。Mask-RCNN是一种在物体检测领域广泛应用的实例分割模型,尤其在处理遥感影像中的建筑物识别时,具有很高的潜力。然而,由于遥感影像中的建筑物类型多样,且常常与周围环境相互融合,传统的图像处理和计算机视觉技术往往难以实现精准和高效的提取。 作者们通过在PyTorch深度学习框架下构建了一个改进版的Mask-RCNN网络模型。这个模型引入了路径聚合网络(Path Aggregation Network, PANet)和特征增强模块,以提升模型对复杂场景的理解和识别能力。路径聚合网络旨在增强上下文信息的捕捉,帮助模型更好地理解建筑物与其他环境元素的关系。特征增强则有助于提高模型对建筑物特征的识别精度,尤其是在低分辨率或高噪声环境下。 在训练过程中,研究团队采用了监督学习和迁移学习相结合的方式。他们利用Inria航空影像标签数据集进行多线程迭代训练,以此优化模型参数,使模型能够快速适应并学习到建筑物的各种形态和特征。这种训练方式可以有效减少过拟合,提高模型泛化能力。 为了验证改进后的Mask-RCNN模型的性能,研究人员将其与其他几种常见的建筑物提取算法,包括支持向量机(SVM)、全卷积网络(FCN)和U-Net进行了对比。实验结果显示,改进的Mask-RCNN在建筑物的自动精确分割和提取方面表现出色。具体而言,它在平均精度(mAP)、召回率(mRecall)、精确率(mPrecision)和F1分数这四个关键评价指标上均超过了其他算法,这证明了其在遥感影像分析领域的优势。 该研究提出的改进Mask-RCNN方法为遥感影像建筑物提取提供了一个有效且高效的解决方案。这种方法不仅可以应对建筑物的多样性,还能处理与环境信息的混淆问题,从而在实际应用中具备广阔的应用前景。未来的研究可能会进一步探索如何将这种方法扩展到其他遥感任务,如道路检测、土地覆盖分类等,以提升整体的遥感影像解析能力。