基于非特定类别的图像前景主体分割算法解决方案
需积分: 0 190 浏览量
更新于2024-08-04
收藏 2.84MB DOCX 举报
非特定类别图像前景主体分割算法
一、图像前景主体分割算法概述
在计算机视觉领域,图像前景主体分割是指从图像中分离出前景主体和背景的过程。传统的语义分割方法对特定类别图像的分割效果较好,但对非特定类别图像的分割效果不理想。因此,本项目提出了一种基于非特定类别的图像前景主体分割算法,旨在解决非特定类别图像的分割问题。
二、U2GE-Net模型架构
本项目的核心模型是U2GE-Net,它基于U2-Net(CVPR2020)算法进行改进。U2GE-Net模型架构如图1.1所示。该模型采用全局上下文嵌入模块来聚合通道信息,引入门控通道注意力模块(GCT),重新设计损失项(增加了边缘loss和IoUloss)。
三、模型组件详解
(一)GCT深度卷积神经网络视觉识别转化单元
GCT(Gate Control Token)是U2GE-Net模型中的一个关键组件。它可以由三部分构成:第一部分通过全局上下文嵌入模块聚合各个通道中的全局上下文信息;第二部分采用与第一部分相似的方式使用l2范数进行规范化,实现通道归一化;第三部分,通过门控机制引入权重γ与门控偏置β,促进神经元的竞争及协同。
(二)边缘分割准确
边缘分割准确是U2GE-Net模型的另一个关键组件。它设计了边缘loss、IoUloss和全局loss来指导整个网络优化。全局loss采用BCEloss对mask和groundtruth进行计算;边缘loss分别对mask和groundtruth使用canny算子进行边缘检测,再对两者进行BinaryCrossEntropyLoss计算;IoUloss先计算mask和groundtruth之间的iou(交并比),使用1-iou作为最终的IoUloss值。
四、技术指标与性能
U2GE-Net模型的技术指标与性能如以下所示:
* 模型大小:7.03MB
* 推理速度:1080p图片约为1s,4k图片约为2.5s
* 可移植性强:通过生成c++推理核心的动态库,通过python调用到pyqt界面中并生成可执行文件,能够实现在多台windows的pc上灵活使用
* Miou值:较改进前算法提升了0.05
五、系统工作流程
系统的工作流程如图3.1所示。用户可以通过前端交互界面选择图像,点击开始推理,推理结束后可以查看推理时间、mask和前景图像。mask和前景图像可以在执行文件的同级目录下的gui_utils内查看。
六、结论
本项目提出了一种基于非特定类别的图像前景主体分割算法,旨在解决非特定类别图像的分割问题。U2GE-Net模型具有轻量型、快速推理和强可移植性的特点,对图像前景主体分割任务具有重要的应用价值。
2022-08-03 上传
2022-08-03 上传
2021-06-29 上传
2021-06-04 上传
2020-03-23 上传
天使的梦魇
- 粉丝: 38
- 资源: 321
最新资源
- 基于Python和Opencv的车牌识别系统实现
- 我的代码小部件库:统计、MySQL操作与树结构功能
- React初学者入门指南:快速构建并部署你的第一个应用
- Oddish:夜潜CSGO皮肤,智能爬虫技术解析
- 利用REST HaProxy实现haproxy.cfg配置的HTTP接口化
- LeetCode用例构造实践:CMake和GoogleTest的应用
- 快速搭建vulhub靶场:简化docker-compose与vulhub-master下载
- 天秤座术语表:glossariolibras项目安装与使用指南
- 从Vercel到Firebase的全栈Amazon克隆项目指南
- ANU PK大楼Studio 1的3D声效和Ambisonic技术体验
- C#实现的鼠标事件功能演示
- 掌握DP-10:LeetCode超级掉蛋与爆破气球
- C与SDL开发的游戏如何编译至WebAssembly平台
- CastorDOC开源应用程序:文档管理功能与Alfresco集成
- LeetCode用例构造与计算机科学基础:数据结构与设计模式
- 通过travis-nightly-builder实现自动化API与Rake任务构建