第
37
卷第
6
期
2012
年
6
月
武汉大学学报·信息科学版
Geomatics and Information Science of Wuhan University
Vo
l.
37
No.6
June 2012
文章编号
:1671-8860(2012)06-0640-04
文献标志码
:A
高光谱影像的改进
K-
均值监督式聚类分析方法
苏红军
1
,
2
盛业华
2
DU
Qian
3
Y
ANG
He
3
cl
河海大学地球科学与工程学院,南京市西康路
1
号,
210098)
(2
南京师范大学虚拟地理环境教育部重点实验室,南京市文苑路
1
号,
210046)
(3
美国密西西比州立大学电子与计算机工程系,美国密西西比斯塔克维尔市,
39762)
摘
要:针对
K
均值聚类存在的初始聚类中心不稳定、聚类数目难以确定的问题,提出利用正交投影散度
(OPD)
优化
K-
均值算法的初始聚类中心,设计了
RD
指标函数用于估计聚类数目队将所提出的算法应用于
高光谱影像特征提取与端元提取分析,实验结采表明,所提出算法的性能高于已有的类似算法。
关键词:高光谱影像;监督
K
均值;端元提取
中图法分类号
:P237.4
由于聚类的非监督特性,其只能利用原始的
高维数据,导致计算复杂度及性能都受到→定程
度的影响。而传统的监督分类由于利用了大量的
先验样本数据,可以大幅提高高光谱影像分类精
度,但是获取足够多的样本数据的难度仍然十分
大。因此,小样本情况下高光谱影像的快速降维
是一个亟需解决的问题。
K-
均值算法作为最早
提出且应用广泛的聚类算法,因简单、高效、鲁棒、
适应性强等优点在数据挖掘、机器学习、模式识
别、遥感领域得到了广泛应用[1-3
J
。但此算法仍有
许多问题没有得到很好的解决,如:①对初始聚
类中心十分敏感,不同的初始聚类中心可能导致
不同的结果;②需要预先指定聚类个数
k
,
当无法
获得数据的先验知识时,无法预测该值的具体大
小。本文将典型地物的光谱数据作为先验样本知
识,设计了监督
K-
均值聚类的高光谱快速降维方
法,同时,提出了一种新的基于正交投影散度
(or
thogonal
projection
divergence
,
OPD)
的
K
均值
初始化方法以及能够有效估计聚类个数
h
的
方法。
1
改进的
K-
均值算法
K-
均值算法的思想为:对于一个给定的包含
n
个对象的遥感数据,以及事先给定的聚类个数
收稿日期:
2012-04-21 0
k
,
该算法利用一定的划分准则函数,通过迭代过
程将数据划分为
h
个组,其中,走
ζ
n
,
每一组代表
一个聚类。划分后的聚类符合聚类算法的原则,
即同一类中的个体有较大的相似性,不同类的个
体具有较大的差异性。
1.
1
K-
均值初始聚类中心的选取
近年来,正交子空间投影
(orthogonal
sub
space
projection
,
OSP)
理论在遥感领域应用广
泛[
4J
为了求解其最优解,需要在高光谱数据中找
到能够使最小二乘估计趋向于最优值的波段。根
据最小二乘估计原理,即最大化端元(代表某一典
型的地物类)与背景之间的距离:
opd
=
rTp
才
ri
(1)
由式(1)可以定义一个对称的光谱测度,即正
交投影散度:
OPD(ri'
η)
=
(rTp
士
ri
十
rJPfr)
川
(2)
其中,
pt=I-rh(rJrh)-lrJ
,
h
=t
,
10
这就是
OPD
的思路,它表达了两个像元向量
r
i
和
rj
之
间的正交投影残差的测度,可以用作不同地物光
谱向量之间相似性的测度指标。此算法继承了
。
SP
的特点,能够有效地分离感兴趣目标信息与
背景信息,提高地物类光谱向量的区分度,利用
OPD
进行波段选择能够选择出较好的算法问。
因此,可以将
OPD
算法的波段选择结果作为
K
均值的初始聚类中心,从而改进
K-
均值因不同的
项目来源:国家自然科学基金资助项目
(40901200);
河海大学中央高校基本科研业务费专项资金资助项目
(2012B01614)
。