弱监督下基于语义纹元森林与显著性预设的图像分割方法

需积分: 12 170 浏览量更新于2024-09-01 1 收藏 836KB PDF 举报

本文主要探讨了一种创新的弱监督图像语义分割方法，名为"基于纹元森林和显著性先验的弱监督图像语义分割"，由韩铮和肖志涛共同提出的。研究背景是传统的弱监督语义分割任务往往依赖于训练集中所有图像的超像素及其相似度来构建图模型，然而这种方法全局建模忽视了单幅图像的局部结构信息，并且容易受到复杂度限制，难以处理大规模的数据。作者们针对这些问题，提出了一个新的解决方案。首先，他们利用随机森林分类器，结合弱监督数据和图像显著性信息，对图像进行特征提取，这些特征被称为语义纹元森林特征（Semantic Texton Forest, STF）。在训练阶段，算法通过训练分类器来学习如何根据图像显著性区分不同的语义区域。在测试阶段，该方法采用了一种两步骤的策略。首先，对输入图像进行过分割，将图像分解为多个超像素。接着，对这些超像素提取语义纹元特征，并运用朴素贝叶斯方法对每个超像素进行标记的概率估计。这种概率估计有助于确定每个超像素所属的语义类别。最后，为了进一步优化分割结果，作者们在条件随机场（Conditional Random Field, CRF）的框架下，引入图像显著性信息，设计了一个新的能量函数表达式。这个能量函数将图像标注问题转化为寻找能量最小化的解，从而实现更精确的语义分割。这种方法避免了全局图模型的构建，降低了复杂度，特别适合大规模数据处理。实验结果显示，即使在没有对整个训练集建立图模型的情况下，仅依赖单幅图像的显著性信息，也能获得良好的分割效果。此外，非参数模型的优势在于其对大规模数据的分析更为有效。该方法在MSRC-21类数据库上得到了验证，证明了其在弱监督条件下语义分割任务中的有效性。关键词包括：语义分割、弱监督学习、显著性检测、语义纹元森林和条件随机场。总体来说，这篇论文提供了一种新颖而有效的解决弱监督图像语义分割问题的方法，对于图像分析和理解领域的研究具有重要意义。

第 40 卷第 3 期电子与信息学报 Vol.40No.3

2018 年 3 月 Journal of Electronics & Information Technology Mar. 2018

基于纹元森林和显著性先验的弱监督图像语义分割方法

韩铮

①②

肖志涛

*①

①

(天津工业大学电子与信息工程学院天津 300387)

②

(赤峰学院物理与电子信息工程学院赤峰 024400)

摘要：弱监督语义分割任务常利用训练集中全体图像的超像素及其相似度建立图模型，使用图像级别标记的监督

关系进行约束求解。全局建模缺少单幅图像结构信息，同时此类参数方法受到复杂度限制，无法使用大规模的弱监

督训练数据。针对以上问题，该文提出一种基于纹元森林和显著性先验的弱监督图像语义分割方法。算法使用弱监

督数据和图像显著性训练随机森林分类器用于语义纹元森林特征(Semantic Texton Forest, STF)的提取。测试时，

先将图像进行过分割，然后提取超像素语义纹元特征，利用朴素贝叶斯法进行超像素标记的概率估计，最后在条件

随机场(CRF)框架下结合图像显著性信息定义了新的能量函数表达式，将图像的标注(labeling)问题转换为能量最

小化问题求解。在 MSRC-21 类数据库上进行了验证，完成了语义分割任务。结果表明，在并未对整个训练集建立

图模型的情况下，仅利用单幅图像的显著性信息也可以得到较好的分割结果，同时非参模型有利于规模数据分析。

关键词：语义分割；弱监督学习；显著性检测；语义纹元森林；条件随机场

中图分类号： TP391.4 文献标识码： A 文章编号：1009-5896(2018)03-0610-08

DOI: 10.11999/JEIT170472

Weakly Supervised Semantic Segmentation Based on Semantic

Texton Forest and Saliency Prior

HAN Zheng

①②

XIAO Zhitao

①

(School of Electronics and Information Engineering, Tianjin Polytechnic University, Tianjin 300387, China)

②

(School of Physics and Electronic Information Engineering, Chifeng University, Chifeng 024400, China)

Abstract: Most previous weakly supervised semantic segmentation works utilize the labels of the whole training set

and thereby need the construction of a relationship graph about image labels. This method lack of structure

information in single image and suffer from enormous quantity parameters which result in expensive computation.

In this study, a weakly-supervised semantic segmentation algorithm is proposed. Under Conditional Random Field

(CRF) framework, an novel energy function expression is developed based on saliency priors as structure context

relationship, which avoids the construction of a huge graph in whole training dataset. Specifically, a nonparametric

random Semantic Texton Forest (STF) is obtained using weakly supervised training data and images saliency.

Then STF feature is extracted from image superpixels and probability estimates of superpixels label is calculated

by naive Bayesian method. Finally, a CRF based optimization algorithm is proposed which can efficiency solved by

alpha expansion algorithm. Experiments on the MSRC-21 dataset show that the new algorithm outperforms some

previous influential weakly-supervised segmentation algorithms with no building graph in whole training set.

Key words: Semantic segmentation; Weakly supervised learning; Saliency detection; Semantic Texton Forest (STF);

Conditional Random Fields (CRF)

1 引言



图像语义分割常作为强监督学习任务来研究，

收稿日期：2017-05-17；改回日期：2017-11-27；网络出版：2017-12-27

*通信作者：肖志涛 xiaozhitao@tjpu.edu.cn

基金项目：高等学校博士学科点专项科研基金(SRFDP

20131201110001)，中国纺织工业协会应用基础研究项目(J201509)，

内蒙古自治区高等学校科学技术研究项目(NJZY237)

Foundation Items: The Specialized Research Fund for the Doctoral

Program of Higher Education (SRFDP20131201110001), The

Applied Basic Research Programs of China National Textile and

Apparel Council (J201509), The Scientific Studies Program of

Higher Education of Inner Mongolia Municipality (NJZY237)

利用像素和标记之间的监督关系训练分类器，对测

试图像的每一个像素预测一个后验概率最大的类。

其学习过程使用的训练数据需要像素级别的强监督

关系，即：训练图像中每一个像素对应一个唯一标

记(label)。这种数据获取非常困难，需要人工标注，

限制了获取训练数据的规模，同时也会带来人为的

强监督偏见

[1]

。与此同时，网络上存有大量的带有图

像级别标记的数据资源未被充分利用。所以利用这

些弱监督关系的数据来实现语义分割成为计算机视

觉领域一个新的课题

[2 11]-

。弱监督语义分割学习任

务中，使用仅有图像级别标记的数据进行训练。训

下载后可阅读完整内容，剩余7页未读，立即下载

olivia_ye

粉丝: 11

弱监督下基于语义纹元森林与显著性预设的图像分割方法

VALSE2018王兴刚教授弱监督语义分割

SEAM:弱监督语义分割的自监督等变注意机制，CVPR 2020（口头）

利用Hough变换和先验知识的车牌字符分割算法_张云刚.pdf

中心先验.rar_object detection_图像先验_显著性_显著性先验_显著性检测中心先验

基于先验信息融合的显著性目标检测算法及其应用研究_周帅骏.caj

条件随机场中嵌入先验信息的图像理解算法研究_李志青.caj

基于深度学习的图像语义分割方法综述.pdf

image_图像_图像处理_图像分割.zip

22.00_03_jeffrey先验.pdf

基于多尺度先验融合的小样本语义分割方法.pdf

最新资源