
第 40 卷第 3 期 电 子 与 信 息 学 报 Vol.40No.3
2018 年 3 月 Journal of Electronics & Information Technology Mar. 2018
基于纹元森林和显著性先验的弱监督图像语义分割方法
韩 铮
①②
肖志涛
*①
①
(天津工业大学电子与信息工程学院 天津 300387)
②
(赤峰学院物理与电子信息工程学院 赤峰 024400)
摘 要:弱监督语义分割任务常利用训练集中全体图像的超像素及其相似度建立图模型,使用图像级别标记的监督
关系进行约束求解。全局建模缺少单幅图像结构信息,同时此类参数方法受到复杂度限制,无法使用大规模的弱监
督训练数据。针对以上问题,该文提出一种基于纹元森林和显著性先验的弱监督图像语义分割方法。算法使用弱监
督数据和图像显著性训练随机森林分类器用于语义纹元森林特征(Semantic Texton Forest, STF)的提取。测试时,
先将图像进行过分割,然后提取超像素语义纹元特征,利用朴素贝叶斯法进行超像素标记的概率估计,最后在条件
随机场(CRF)框架下结合图像显著性信息定义了新的能量函数表达式,将图像的标注(labeling)问题转换为能量最
小化问题求解。在 MSRC-21 类数据库上进行了验证,完成了语义分割任务。结果表明,在并未对整个训练集建立
图模型的情况下,仅利用单幅图像的显著性信息也可以得到较好的分割结果,同时非参模型有利于规模数据分析。
关键词:语义分割;弱监督学习;显著性检测;语义纹元森林;条件随机场
中图分类号: TP391.4 文献标识码: A 文章编号:1009-5896(2018)03-0610-08
DOI: 10.11999/JEIT170472
Weakly Supervised Semantic Segmentation Based on Semantic
Texton Forest and Saliency Prior
HAN Zheng
①②
XIAO Zhitao
①
①
(School of Electronics and Information Engineering, Tianjin Polytechnic University, Tianjin 300387, China)
②
(School of Physics and Electronic Information Engineering, Chifeng University, Chifeng 024400, China)
Abstract: Most previous weakly supervised semantic segmentation works utilize the labels of the whole training set
and thereby need the construction of a relationship graph about image labels. This method lack of structure
information in single image and suffer from enormous quantity parameters which result in expensive computation.
In this study, a weakly-supervised semantic segmentation algorithm is proposed. Under Conditional Random Field
(CRF) framework, an novel energy function expression is developed based on saliency priors as structure context
relationship, which avoids the construction of a huge graph in whole training dataset. Specifically, a nonparametric
random Semantic Texton Forest (STF) is obtained using weakly supervised training data and images saliency.
Then STF feature is extracted from image superpixels and probability estimates of superpixels label is calculated
by naive Bayesian method. Finally, a CRF based optimization algorithm is proposed which can efficiency solved by
alpha expansion algorithm. Experiments on the MSRC-21 dataset show that the new algorithm outperforms some
previous influential weakly-supervised segmentation algorithms with no building graph in whole training set.
Key words: Semantic segmentation; Weakly supervised learning; Saliency detection; Semantic Texton Forest (STF);
Conditional Random Fields (CRF)
1 引言
图像语义分割常作为强监督学习任务来研究,
收稿日期:2017-05-17;改回日期:2017-11-27;网络出版:2017-12-27
*通信作者:肖志涛 xiaozhitao@tjpu.edu.cn
基金项目:高等学校博士学科点专项科研基金(SRFDP
20131201110001),中国纺织工业协会应用基础研究项目(J201509),
内蒙古自治区高等学校科学技术研究项目(NJZY237)
Foundation Items: The Specialized Research Fund for the Doctoral
Program of Higher Education (SRFDP20131201110001), The
Applied Basic Research Programs of China National Textile and
Apparel Council (J201509), The Scientific Studies Program of
Higher Education of Inner Mongolia Municipality (NJZY237)
利用像素和标记之间的监督关系训练分类器,对测
试图像的每一个像素预测一个后验概率最大的类。
其学习过程使用的训练数据需要像素级别的强监督
关系,即:训练图像中每一个像素对应一个唯一标
记(label)。这种数据获取非常困难,需要人工标注,
限制了获取训练数据的规模,同时也会带来人为的
强监督偏见
[1]
。与此同时,网络上存有大量的带有图
像级别标记的数据资源未被充分利用。所以利用这
些弱监督关系的数据来实现语义分割成为计算机视
觉领域一个新的课题
[2 11]-
。弱监督语义分割学习任
务中,使用仅有图像级别标记的数据进行训练。训