U-Net网络在遥感图像语义分割中的应用与效果提升

需积分: 0 96 下载量 125 浏览量 更新于2024-06-30 5 收藏 9.58MB PDF 举报
"这篇学士学位论文探讨了基于U-Net网络的遥感图像语义分割技术,旨在解决传统遥感图像分割中的自动化难题。U-Net是一种全卷积网络,特别适合于图像分割任务,尤其在遥感图像处理中具有潜力。论文详细介绍了全卷积网络的概念以及U-Net的对称结构,强调了其在网络结构中的重要性。实验设计部分涵盖了数据集的选择和处理,以及图像处理流程和网络结构的设计。论文中还提出了类别平衡交叉熵损失函数,以改善模型训练效果,并在预测阶段应用开运算优化结果。通过比较和评估,该方法在F1Score和召回率上均有所提升,尤其是在InriaAerialImageLabelingDataset上的建筑识别表现优于传统的交叉熵损失函数。" 本文首先介绍了全卷积网络(FCN)的基础知识,这种网络结构能够直接输出像素级别的预测,非常适合于像遥感图像语义分割这样的密集预测任务。全连接网络虽然在分类任务上表现出色,但对于像素级别的分割任务,它们通常无法保持足够的空间分辨率。因此,FCN通过将全连接层替换为卷积层,使得网络可以保留输入图像的空间信息。 U-Net网络是一种特殊的FCN,其结构特点是具有对称的收缩和扩张路径。收缩路径负责捕捉图像的上下文信息,而扩张路径则用于恢复原始输入的空间分辨率,这样可以精确地定位和分割图像中的各个对象。在实际操作中,论文提到先对数据集进行预处理,如分割和通道分离,然后输入到U-Net进行训练。 在实验设计部分,作者选择了合适的遥感图像数据集,并设计了图像处理流程,包括可能的增强和归一化步骤。网络结构的设计和调整是关键,因为它直接影响模型的性能。同时,为了改善训练过程,论文提出了类别平衡交叉熵损失函数,以解决类别不平衡问题,这对于遥感图像中的小目标检测尤为重要。 预测阶段,使用训练好的模型对大尺寸遥感图像进行分割,并通过开运算进一步优化结果,以去除噪声和连接的小块区域。最后,通过accuracy和F1Score等评价指标对模型性能进行评估,结果显示提出的类别平衡交叉熵损失函数在F1Score和召回率上有显著提升,特别是在识别建筑物等特定目标时,性能优于常规的交叉熵损失函数。 这篇论文深入探讨了U-Net在遥感图像语义分割中的应用,通过优化损失函数和网络结构,提高了遥感图像分割的准确性和效率,对于未来在遥感图像分析和处理领域的发展具有重要的参考价值。