首次点击引导的交互式图像分割：FCA-Net方法

77 浏览量更新于2025-01-16 收藏 1.54MB PDF 举报

交互式图像分割是计算机视觉中的一个重要研究领域，它旨在通过最少的用户输入实现对图像中感兴趣对象的精确分割。这种方法在图像编辑、医学影像分析等领域具有广泛的应用，特别是在深度学习技术推动下，对于高质量掩码标注的需求日益增长。传统的交互方式包括边界框、涂鸦和点击等，其中点击作为一种直观且便捷的方式，尤其受到关注。在传统的基于点击的交互式分割方法中，所有点击都被同等对待，没有特别强调第一次点击的重要性。然而，第一次点击往往包含了用户对目标对象的初步感知和定位信息，具有较高的指导价值。首次点击注意力网络（FCA-Net）正是针对这一点提出的一个创新框架。FCA-Net设计了一种深层模型，融合了聚焦不变性、位置引导和容错能力，使得网络能够充分利用第一次点击的精确性，提高交互式分割的精度和效率。该网络的核心在于其新颖的损失函数和结构完整性策略。损失函数设计考虑了第一次点击的特殊性，能够更有效地调整模型的预测。结构完整性策略则确保分割结果的整体一致性，避免孤立的误分区域。实验结果显示，FCA-Net在可视化分割结果和多个数据集上表现出色，显著优于其他方法，证明了第一次点击的不可或缺以及FCA-Net在交互式分割领域的优越性能。交互式图像分割中的首次点击注意机制是一个重要的研究方向，它不仅改变了传统方法的交互逻辑，还推动了深度学习在该领域的应用。FCA-Net作为这一创新的代表，展示了如何通过智能利用用户的初次输入，提升交互式图像分割的准确性和用户体验。未来的研究将继续探索更高效、更智能的交互方式，以满足不断增长的实际需求。

13341

第一次点击注意

距离图高斯图

首先单击

首次点击损失

正点击

负点击

监督结果

地面实况

一般点击损失

结果

图像

ResNet

ASPP

解码器

图

2. FCA

网络的整体架构。绿色部分显示了基本的分段网络，包括主干、

ASPP

和解码器模块。橙色部分显示了第一个点击关

注模块。符号“”和“↑”分别表示级联和上采样操作。请咨询第3.1更多详情

一种用于交互式分割的双流融合网络。Jang和Kim [25]

提供了一种反向传播细化方案，以强制每个交互点具

有正确的分割结果。Majumder和Yao [37]根据其他一

些信息（如超像素），利用交互点生成特殊的指导图

作为神经网络的所有这些方法都有一个共同点，即它

们不加区别地处理神经网络中的所有相互作用点然

而，我们发现并提出了第一点的唯一性，并将其作为

我们的网络架构的特殊指导。

该方法

本节包括五个部分。节中3.1中，我们介绍了我们提

出的FCA网络，它专门处理第一点节中3.2中，我们描

述了建议的点击损失的计算过程节中3.3，我们解释了

后处理的结构完整性策略

分成基本分段网络和第一点击关注模块。

基本细分网络。在[25，30，31，37，47]之后，我们

采用了通用的FCN架构，其特定结构类似于DeepLab

v3+ [7]。如图所示在图2中，它包含三个部分：骨

干网， Atrous空间金字塔池化（ASPP）模块，以及

解码器模块。我们以ResNet101 [22]为骨干。我们将

最后四个阶段的特征表示为：

，

}。为了在交互分割中捕获多尺度对

象，我们还采用了膨胀卷积

在ResNet101的最后一个阶段，而不是大步前进，

2.因此，主干的输出步幅为16。主干的输入是RGB图

像与两个高斯映射的注释的阳性点和注释的阴性点连

接。高斯图是根据欧几里德距离图计算的，如图所

示。二、我们实验中的高斯半径设置为10。

对于图中所示的ASPP模块，2、输入端为con-

FCA-Net的预测节中3.4、我们分析一些

连锁要素

FCA

），其中

“

欺诈”指欺诈─

通过一些方式来获得第一次点击关注的好处

连接操作和F

FCA

是指第一个

比较例。最后，我们将展示一个简单的-

我们的交互点模拟策略和第二节中的训练设置的心理

学细节。三点五

3.1.

网络架构

FCA网络的架构如图所示。二、为了更好地解释第

一次点击的有效性，我们没有对广泛使用的交互式分

割的网络结构做太多的修改。相反，一个简单的附加

模块称为第一次点击注意模块被添加到基本的细分网

络。因此，FCA-Net可以

点击关注模块。连接的特征被馈送到具有不同扩张大

小1，6，12，18和全局平均池化层的四个扩张卷积层

然后，五个分支的输出特征被连接并馈送到一个额外

的卷积层。对于图1所示的解码器模块，2、以低层特

征

和ASPP的输出特征作为输入，利用卷积层生成最

终的预测结果。为了监督预测结果，我们设计了一个

基于点击的损失函数来代替传统的二进制交叉熵损失

函数。我们称之为一般点击损失，这是在第二节详细

介绍3.2.

剩余10页未读，继续阅读

cpongm

粉丝: 6

首次点击引导的交互式图像分割：FCA-Net方法

基于融合多尺度标记信息的深度交互式图像分割.docx

基于Random walker 的图像分割

pegbis-master_imagesegmentation_python_Grabcut_

EfficientSAM

transformer模型及扩展

立体图像中的显着对象分割

基于LabVIEW的情人节拼图小游戏.rar.zip

医学标注软件ITK。。。。

介绍vtk可视化的基础

蚁群算法及其实现方法研究1

最新资源