U-Net网络在遥感图像语义分割中的应用与效果提升

需积分: 0 125 浏览量更新于2024-06-30 5 收藏 9.58MB PDF 举报

"这篇学士学位论文探讨了基于U-Net网络的遥感图像语义分割技术，旨在解决传统遥感图像分割中的自动化难题。U-Net是一种全卷积网络，特别适合于图像分割任务，尤其在遥感图像处理中具有潜力。论文详细介绍了全卷积网络的概念以及U-Net的对称结构，强调了其在网络结构中的重要性。实验设计部分涵盖了数据集的选择和处理，以及图像处理流程和网络结构的设计。论文中还提出了类别平衡交叉熵损失函数，以改善模型训练效果，并在预测阶段应用开运算优化结果。通过比较和评估，该方法在F1Score和召回率上均有所提升，尤其是在InriaAerialImageLabelingDataset上的建筑识别表现优于传统的交叉熵损失函数。" 本文首先介绍了全卷积网络（FCN）的基础知识，这种网络结构能够直接输出像素级别的预测，非常适合于像遥感图像语义分割这样的密集预测任务。全连接网络虽然在分类任务上表现出色，但对于像素级别的分割任务，它们通常无法保持足够的空间分辨率。因此，FCN通过将全连接层替换为卷积层，使得网络可以保留输入图像的空间信息。 U-Net网络是一种特殊的FCN，其结构特点是具有对称的收缩和扩张路径。收缩路径负责捕捉图像的上下文信息，而扩张路径则用于恢复原始输入的空间分辨率，这样可以精确地定位和分割图像中的各个对象。在实际操作中，论文提到先对数据集进行预处理，如分割和通道分离，然后输入到U-Net进行训练。在实验设计部分，作者选择了合适的遥感图像数据集，并设计了图像处理流程，包括可能的增强和归一化步骤。网络结构的设计和调整是关键，因为它直接影响模型的性能。同时，为了改善训练过程，论文提出了类别平衡交叉熵损失函数，以解决类别不平衡问题，这对于遥感图像中的小目标检测尤为重要。预测阶段，使用训练好的模型对大尺寸遥感图像进行分割，并通过开运算进一步优化结果，以去除噪声和连接的小块区域。最后，通过accuracy和F1Score等评价指标对模型性能进行评估，结果显示提出的类别平衡交叉熵损失函数在F1Score和召回率上有显著提升，特别是在识别建筑物等特定目标时，性能优于常规的交叉熵损失函数。这篇论文深入探讨了U-Net在遥感图像语义分割中的应用，通过优化损失函数和网络结构，提高了遥感图像分割的准确性和效率，对于未来在遥感图像分析和处理领域的发展具有重要的参考价值。

2 郭子睿：基于 U-Net 网络的遥感图像语义分割

年出现了全卷积神经网络对图像进行像素级语义分割。全卷积神经网

络计算量小且能接受任意尺寸的输入图像。U-Net 是一种由全卷积神经

网络启发的对称结构网络，在医疗影像分割领域取得了很好的效果。

此次研究尝试使用 U-Net 网络在对多光谱遥感影像数据集上进行

训练，尝试使用卷积神经网络自动分割出建筑，希望能够得到一种自

动分割遥感影像的简便方法。

1.2 国内外研究现状

自计算机用于图像处理以来，图像分割一直是一个受到广泛关注

的问题。语义分割在图像分割的基础上对分割的内容提出了要包含语

义信息的要求。遥感图像较以往的自然场景下的图像有相近处也有些

许不同。

1.2.1 语义分割研究现状

基于特征的语义分割方法图像分割问题从计算机被用于处理的那天开始

就是图像处理领域的一个核心问题。基于特征的图像分割技术主要被

分为以下五个类别。

第一种方法是基于阈值的分割方法。图像分割技术在计算机发展

早期受到计算机性能的限制，只能依据图像的底层特征对图像进行分

割。这种方法的核心思想是利用图像的灰度特征。我们将设置一个或

多个超参数：灰度阈值，通过将图像中的像素与我们设定的灰度阈值

进行比较，逐一将像素分割到其合适的类别。这种方法可以分为自动

设定灰度阈值的方法，如大津二值化算法

[1]

和手动设置灰度阈值的方

法两种。第二种方法是基于边缘的分割方法。在图像两个不同区域的

边界上，纹理、灰度和颜色等图像特征会产生突变。根据这一思想，基

中国地质大学学士学位论文 3

于边缘的分割方法主要关注边缘处的特征突变。根据这一突变对图像

进行分割。第三种方法是基于区域的分割方法。该类方法中最著名的

方法是归一化割

[2]

和分水岭算法

[3]

。这种分割方法主要依赖图像的相

似性将图像划分为不同区域块。第四种基于图论的方法把图像分割问

题看做图的最小割问题。这种方法的目标是最大化子图内部的相似度

同时最小化子图之间的相似度。第五种方法是基于能量泛函的分割方

法

[4]

。这种方法是一类以活动轮廓模型为基础，在此基础上演变、发展

出来的一系列算法。这一系列算法的主要方法是利用连续曲线来表示

目标的边缘并确定能量泛函，使其自变量变量包括边缘曲线。这样图

像分割的过程就转变为了最小化这个能量泛函的过程。

传统机器学习语义分割方法除此之外，机器学习不仅仅是在近几年

才应用于图像分割任务上的。机器学习中的聚类算法如 K-means

[5]

、谱

聚类

[6]

等也被尝试应用于图像分割任务。通常的思路是利用诸如颜色、

亮度、纹理等特征对像素点进行聚类。

语义分割则对图像分割做了更高的要求，即分割的内容具有语义

可解释性。虽然像聚类这样的无监督机器学习方法可以用于图像分割，

但分割的结果不一定有语义。较简单的图像分割任务相比，语义分割

能是我们对图像有更加细致的了解。传统的图像分割算法中主要是基

于底层的特征，而基于语义的分割算法可以基于图像中高层内容信息

对图像进行分割。因此语义分割算法在对结构复杂，内部差异性大的

物体进行分割的时候表现较传统图像分割技术好。遥感图像中，既有

道路、森林等有相对固定的纹理的物体，也有建筑、港口等较为复杂的

物体。对于简单的物体的分割，传统的基于图论的方法和基于像素聚

类的方法可能会对我们有所启示；而那些复杂的物体基于语义图像分

割技术可能会有更好的效果。

深度学习方法在 2012 年 AlexNet

[7]

发表之后取得了巨大的进展，

被用于多个计算机视觉领域，其中就包括图像分割领域。由于卷积神

剩余40页未读，继续阅读

易烫YCC

粉丝: 30
资源: 315

U-Net网络在遥感图像语义分割中的应用与效果提升

基于 u-net 网络的遥感图像语义分割_郭子睿

毕业设计 基于UNet的遥感图像语义分割.zip

20210507-平安证券-前瞻性产业研究周报：数字创新平台成功搭建新能源汽车发展势力迅猛.pdf

Rust 学习教程（入门到实践）

基于springboot+Web的毕业设计选题系统源码数据库文档.zip

(源码)基于Spring和MyBatis的疫情防控管理系统.zip

对数据集进行二分类，有数据集和源码以及模型，二分类是识别猫和不是猫的情况，可做毕业设计

网购商城系统源码 网店买卖交易平台 积分兑换商城系统源码.zip

编译好的Linux版网络调试助手

Microsoft-Office-2019-VL-Serializer-Universal office使用软件

最新资源

毕业设计基于UNet的遥感图像语义分割.zip

网购商城系统源码网店买卖交易平台积分兑换商城系统源码.zip