Joumal of Computer Applications
计算机应用,
2012
,
32( 8) : 2291 - 2295, 2298
ISSN 1001-9081
CODENJYIIDU
2012-08-01
http://www.joca.cn
文章编号
:1001
-9081(2012)08
-2291
-05
doi:10.3724/SP.J.1087.2012.02291
改进的判别割及其在图像分割中的应用
邹小斗才二
(肇庆学院数学与信息科学学院,广东肇庆
526061)
(
*通信作者电子邮箱直
1
削
linzou@
gmai
l.
com)
摘
要:谱聚类算法能在任意形状的样本空间上聚类且收敛于全局最优解,但判别割
(Dcut)
算法在计算正则化
相似度矩阵及其特征向量时比较耗时,而基于子空间的
Dcut
( SDcut
)算法则不稳定,为此,提出基于主成分分析
(PCA)
的
Dcut
算法
(PCA-Dcut)
0
PCA-Dcut
算法采用
PCA
算法计算相似度矩阵的前
m
个大的特征值对应的特征向
量构造一个新的矩阵,然后采用构造的矩阵与相似度矩阵和拉普拉斯矩阵分别进行矩阵运算;接着通过计算获得一
个
m
阶正则化相似度矩阵,并计算该矩阵的
k
个最大特征向量;最后使用构造的矩阵与这
k
个特征向量相乘获得最终
用于分类的特征向量。
PCA-Dcut
算法能降低
Dcut
算法的计算复杂度。通过对人工合成数据集、
UCI
数据集和真实图
像的仿真实验表明,
PCA-Dcut
算法的聚类准确率与
Dcut
等谱聚类算法相当,同时在分割图像时的运算速度约为
Dcut
的
5
.4倍,并具有比
SDcut
更快的速度和更好的性能。
关键词:谱聚类;判别割算法;主成分分析;图像分宰
.'J
中图分类号
:T
凹
9
1.
41
文献标志码
:A
Improved Dcut and its application in image segmentation
ZOU
Xiao-lin
*
(School
0/
M
,
α
them
α
tics
and
Information
Scie
旧时
,
Z
加
oqing
University,
Zh
α
oqing
Gu
α
ngdong
526061
,
Chin
α)
Abstract:
Spectral clustering algorithms
can
cluster samples in any form of feature space and has global optimal
solutions. However
, Discriminant
cut
(Dcut)
algorithm is
time-consumi
吨
when
calculating the regularization similarity
matri
芷
and its eigenvectors and Dcut based Subspace (SDcut)
algor
讪
1m
is unstable. Conceming these problems, the paper proposed
an improved Dcut algorithm based on Principal Component Analysis
(PCA)
, named PCA-Dcut. PCA-Dcut algorithm
constructed a new matrix using the
m eigenvectors corresponding to the m largest eigenvalues of the similarity matrix, then
used matrix computation between the constructed matrix with the similarity matrix and Laplacian matrix respectively
, and got
an
m-order
regularization similarity
matri
直,
and calculated its eigenvectors, then used the constructed
matri
直
to
multi ply the
eigenvectors to get the final feature vectors for classification. Therefore
, PCA-Dcut reduces the computational
comple
直
ity
of
Dcu
t. The experiments on man-made data set, UCI data set and real images show that the PCA-Dcut algorithm is comparable
with other spectral clustering algorithms such as Dcut in accuracy
, and its running speed is 5
.4
times of Dcut, and has faster
speed and better performance compared with SDcu
t.
Key
words:
spect
甘
ral
clustering;
Discrim
】
man
时
t
cut
(Dcu
川
1
川
t)
al
与
gori
由
t
由
hr
口
m;
segmen
时It
a
时
t
lO
n
I
。
引言
聚类分析是模式识别、机器学习以及数据挖掘等领域的
一个重要应用工具,是一种非常有效的数据分析方法,因此被
广泛应用在机器视觉、文本检索和语音识别等领域。传统的
聚类算法有
K
均值
(K-means)
算法、最大期望
(E
直
pe
盯
tation
Maximization ,
EM
)算法等
[IJ
。这些传统的聚类算法在样本空
间是凸球形或者接近凸球形时聚类效果较好,但当样本空间
是非凸球形时往往会陷入局部最优,达不到理想的效果。为
了在任意形状的数据样本空间中能够正确聚类并且收敛于全
局最优解,国内外的研究者提出了一系列谱聚类(
Spectral
Clustering)
[2
-7J
算法。谱聚类算法的核心思想:酋先转换数据
的特征空间,然后在转换的特征空间中采用
K-means
等传统聚
类算法对数据进行聚类,最后把聚类的结果映射回原数据
空间。
谱聚类是一种基于任意两个数据点之间的相似关系的聚
类方法
[8J
。该类算法先把聚类问题转换成一个带权无向国
的多路划分问题,再采用一种有效的松弛形式把图划分问题
转化为特征分解问题,即为计算数据的
Laplacian
矩阵的特征
向量,从这些特征向量中选择一些特征向量向造新的数据进
行聚类,获得图谱划分准则的全局最优解。与其他传统的聚
类方法相比,谱聚类算法的最大优势是具有识别非高斯分布
数据的能力,非常适合应用于许多实际问题山,已经成功应
用于并行计算川、超大规模集成电路(
Very Large Scale
Integration
,
VLS
I)的设计川、文本数据挖掘川、生物信息挖
掘
[13J
以及图像分割
[2J
等方面。在谱聚类算法中,比较经典的
有
Shi
等
[2J
提出的正则割算法
(Normalized
cut ,
Ncut)
与
Ng
等[
4J
提出的
k-way
划分的
N
舍
Jordan-Wesis
(NJW)
算法。此
外,为解决谱聚类算法不适用于大规模数据的问题,
Fowlkes
等
[14J
在
2004
年提出基于
Nyström
逼近的谱聚类方法,该算法
降低了计算
Laplacian
矩阵的特征值和特征向量的复杂度。
王玲等
[5J
设计了密度敏感的相似性度量并将其引入到谱聚
收稿日期
:2012-01-20
;修回日期
:2012-03-06
0
基金项目:国家自然科学基金资助项目
(60975083
)。
作者简介:邹小林(1
975
- )
,男,湖南衡阳人,讲师,博士,主要研究方向:模式识别、图像处理。