全卷积网络在类别非均衡遥感图像语义分割中的应用

7 下载量 99 浏览量 更新于2024-08-28 收藏 19.52MB PDF 举报
"类别非均衡遥感图像语义分割的全卷积网络方法,通过U-Net模型,利用数据标准化和增强预处理,结合Adam优化器进行模型训练,并使用平均Jaccard指数评估性能。文章提出加权交叉熵损失函数和自适应阈值策略提升小类别预测准确性,在DSTL数据集上实验,平均Jaccard指数从0.611提高到0.636,实现了高分辨率遥感图像的精确端到端分类。" 本文关注的是遥感图像处理中的一个重要问题——类别非均衡语义分割。遥感图像语义分割是将图像中的每个像素分配到特定类别中的任务,这对于理解和分析地球表面特征至关重要。然而,类别非均衡意味着某些类别的像素数量远多于其他类别,这可能导致模型在预测稀有类别时表现不佳。 全卷积网络(FCN)是一种深度学习模型,特别适用于图像分割任务,因为它能够保留输入图像的空间信息并直接输出与输入同样大小的像素级预测。本文提出的FCN模型是基于U-Net结构,U-Net具有编码器-解码器架构,能有效捕获全局和局部特征,适合处理高分辨率图像。 为了应对类别非均衡,文章采用了一些关键策略。首先,数据预处理包括数据标准化,以确保不同特征在同一尺度上,以及数据增强,如旋转、翻转等,以增加模型对图像变化的泛化能力。其次,模型训练使用了Adam优化器,这是一种自适应学习率优化算法,可以快速收敛并适应不同的数据特性。此外,为了改善小类别的预测精度,模型利用加权交叉熵损失函数,给小类别分配更高的权重,使得在训练过程中,模型更加关注这些类别。同时,自适应阈值方法被用于调整分类决策边界,进一步优化小类别的识别。 实验在DSTL数据集上进行,该数据集包含多个类别且类别分布不均衡。通过应用提出的FCN模型,预测结果的平均Jaccard指数(一种衡量分割准确性的指标)从0.611提升到0.636,这表明方法的有效性。平均Jaccard指数的提升意味着模型在保持整体分类性能的同时,显著提高了对小类别的识别能力。 这项工作为处理类别非均衡的遥感图像语义分割提供了一个创新的解决方案,其全卷积网络模型结合数据预处理和优化策略,为提高高分辨率遥感图像的端到端分类精度提供了新的思路。这种方法对于环境监测、城市规划、灾害响应等领域的遥感图像分析具有重要的实践价值。