基于非特定类别的图像前景主体分割算法解决方案

需积分: 0 2 下载量 190 浏览量 更新于2024-08-04 收藏 2.84MB DOCX 举报
非特定类别图像前景主体分割算法 一、图像前景主体分割算法概述 在计算机视觉领域,图像前景主体分割是指从图像中分离出前景主体和背景的过程。传统的语义分割方法对特定类别图像的分割效果较好,但对非特定类别图像的分割效果不理想。因此,本项目提出了一种基于非特定类别的图像前景主体分割算法,旨在解决非特定类别图像的分割问题。 二、U2GE-Net模型架构 本项目的核心模型是U2GE-Net,它基于U2-Net(CVPR2020)算法进行改进。U2GE-Net模型架构如图1.1所示。该模型采用全局上下文嵌入模块来聚合通道信息,引入门控通道注意力模块(GCT),重新设计损失项(增加了边缘loss和IoUloss)。 三、模型组件详解 (一)GCT深度卷积神经网络视觉识别转化单元 GCT(Gate Control Token)是U2GE-Net模型中的一个关键组件。它可以由三部分构成:第一部分通过全局上下文嵌入模块聚合各个通道中的全局上下文信息;第二部分采用与第一部分相似的方式使用l2范数进行规范化,实现通道归一化;第三部分,通过门控机制引入权重γ与门控偏置β,促进神经元的竞争及协同。 (二)边缘分割准确 边缘分割准确是U2GE-Net模型的另一个关键组件。它设计了边缘loss、IoUloss和全局loss来指导整个网络优化。全局loss采用BCEloss对mask和groundtruth进行计算;边缘loss分别对mask和groundtruth使用canny算子进行边缘检测,再对两者进行BinaryCrossEntropyLoss计算;IoUloss先计算mask和groundtruth之间的iou(交并比),使用1-iou作为最终的IoUloss值。 四、技术指标与性能 U2GE-Net模型的技术指标与性能如以下所示: * 模型大小:7.03MB * 推理速度:1080p图片约为1s,4k图片约为2.5s * 可移植性强:通过生成c++推理核心的动态库,通过python调用到pyqt界面中并生成可执行文件,能够实现在多台windows的pc上灵活使用 * Miou值:较改进前算法提升了0.05 五、系统工作流程 系统的工作流程如图3.1所示。用户可以通过前端交互界面选择图像,点击开始推理,推理结束后可以查看推理时间、mask和前景图像。mask和前景图像可以在执行文件的同级目录下的gui_utils内查看。 六、结论 本项目提出了一种基于非特定类别的图像前景主体分割算法,旨在解决非特定类别图像的分割问题。U2GE-Net模型具有轻量型、快速推理和强可移植性的特点,对图像前景主体分割任务具有重要的应用价值。