Transformer与多尺度并行注意提升结直肠息肉分割精度

需积分: 1 2 下载量 189 浏览量 更新于2024-08-04 1 收藏 776KB PDF 举报
本文档探讨了一种创新的计算机视觉方法,即融合Transformer和多尺度并行注意的结直肠息肉分割算法(Fusion of Transformer and Multi-scale Parallel Attention Networks, FTMPA-Net)。针对结直肠息肉图像中的复杂特性,如病灶尺度变化大、形状不规则和边界模糊,传统分割方法往往面临精确度低和伪影问题。为此,研究者梁礼明、何安军、阳渊和朱晨锟团队提出了Fusion Transformer网络结构,旨在解决这些问题。 首先,他们采用了HardNet模型,结合逐层提取的语义信息和空间细节,增强了对图像特征的理解。接着,引入了多尺度感受场模块(Multi-scale Receptive Field Block, RFB),以便捕捉不同视野范围内的特征,有助于更好地识别息肉的特征模式。为了减少背景颜色对分割的影响,他们应用了高效的通道注意力机制,通过关注空间和通道特征的相关性,增强特征图的质量。 在分割过程的关键阶段,通过并行解码模块逐步聚合经过通道注意力增强的特征,生成初步的分割图,这为后续的深层监督提供了基础。然后,为了进一步细化边缘信息,研究人员设计了高效多头注意力机制(Efficient Multi-head Self-Attention Module, EMHSA),它有助于建立区域与边界之间的内在联系,提升了分割的精度和边界清晰度。 实验结果在CVCClinicDB和Kvasir-SEG两个数据集上进行了验证,平均相似性系数分别达到了95.58%和92.34%,平均交并比分别为91.70%和86.77%,这些数值显示出FusionTPA-Net在提高分割精度和减少伪影方面显著优于现有的算法。综合来看,这项工作不仅解决了结直肠息肉分割的难题,而且在视觉效果和量化评估上都展现出了优越性,对于医疗影像分析和人工智能辅助诊断具有重要意义。