没有合适的资源?快使用搜索试试~ 我知道了~
首页性判别分析方法FDA总结
性判别分析方法FDA总结
5星 · 超过95%的资源 需积分: 43 11 下载量 98 浏览量
更新于2023-06-10
收藏 328KB PDF 举报
FDA总结 2.1 Fisher Discriminant Analysis 2.1.1 两类情况 2.1.2 多类情况 2.2 判别向量之间的相关性 2.2.1正交LDA(FSLDA) 2.2.2 不相关的LDA(ULDA) 2.2.3 一个融合准则 2.3 SSS问题及其解决 2.3.1 代数方法 2.3.2 两步方法 2.3.3判别空间分析. 2.3.4 其它方法 2.4 关于类间散布矩阵 2.5其它线性判别分析方法 2.6 ILDA 2.7核LDA 2.8 2D-LDA 2.9 PCA和LDA的比较
资源详情
资源推荐
FDA 总结(梧桐细雨 2012)--各种各样的 FDA
在模式分类中经常遇到的问题是维数灾难,对于低维数据非常适用的方法很可能无法运
用到高维数据上。因此各种各样的降维方法应运而生。从第一章的介绍中我们可以看出 PCA
是一种有效的降维方法,它的结果是与原数据最接近的投影数据,但在模式分类中此方法并
不具有竞争力。因为选择投影空间时不同类数据之间的可分性并没有被考虑。如果要把 D 维
数据投影到一个
Ddd 维空间,即一条直线上,那么原本可分的样本在投影后可能混合
在一起。不过我们可以通过选择合适的投影轴来使投影后的数据具有最好的可分性。这正是
线性判别分析的目的。
2.1 Fisher Discriminant Analysis
1936 年,Fisher 提出了经典的 Fisher 线性判别方法[1]并被广泛应用。在介绍 Fisher 线
性判别分析前我们先做一些必要的假设。假设
12
, ,...,
c
是 D 维空间中的 c 个已知类,第
i
类中的样本个数为
i
n 个,总的样本个数为
1
c
i
i
Nn
。我们把第
i
类中的第
j
个样本记为
1;1
i
ji
x
ic jn ,也可以不区别类标的把它记作
1
k
x
kN 。假设第 i 类样本个
数占总体样本个数的比例,即先验概率为
i
p
,因为有 c 类,我们有
1
1
c
i
i
p
。
2.1.1 两类情况[2]
我们首先考虑
2c
的情况,即所有的数据均来自两个不同的类。样本
x
各维元素的线
性组合可以表示为
T
y
x
(1)
对每个样本进行此操作得到
12;1
i
ji
yi jn 。从几何上看,在 1
的情况下,每
个
i
j
y 都是
i
j
x
在方向为
的直线上的投影。
的模只会影响投影后样本的模,对于分类问题
来说没有任何实际意义,可以任意取。但
方向的选择对投影后样本的可分性有着至关重
要的影响。
一个衡量样本可分性的标准是两类样本均值的距离。样本均值的距离越大,我们可以近
似的认为两类样本分得越开,能得到越高的分类正确率。投影后样本的均值为
'
11
11
ii
nn
iTiT
ij ji
jj
ii
my xm
nn
(2)
其中
1
1
i
n
i
ij
j
i
mx
n
。两类样本均值的距离为
''
12 12
T
mm mm
(3)
我们可以选择适当的
使上式最大。
定义投影后样本的的散布为
2
'
1
i
n
i
iji
j
sxm
(4)
我们把
''
12
ss
称为总体散布。Fisher 线性判别的的准则为
''
12
''
12
mm
Jw
ss
(5)
目标是使此准则最大化。把此式表示为
和原样本的函数得到
T
b
T
w
S
Jw
S
(6)
其中
1212
2
11
i
T
b
n
T
ii
wjiji
ij
Smmmm
Sxmxm
(7)
我们把
b
S 和分别称作类间散布矩阵各类内散布矩阵。通过公式推导得到
的最优值为
1
12
w
Smm
(8)
2.1.2 多类情况[2]
X?,可以把 Fisher 线性判别分析推广到多类的情况.。当 2c 时,定义
11
i
n
c
T
ii
wjiji
ij
Sxmxm
(9)
1
c
T
bii i
i
S nmmmm
(10)
其中
11
1
i
n
c
i
j
ij
mx
N
为全体样本的均值。类内和类间散布矩阵的和定义为总体散布矩阵
11
i
n
c
T
ii
tbw j j
ij
SSS xmxm
(11)
Fisher 准则的定义如前
T
b
T
w
S
Jw
S
(12)
它的分母和分子分别表示了同类样本和不同类样本分开的程度,通过最大化该准则可以同时
实现两个目的:不同类样本最大程度的分开;同类样本最大程度的聚集,即能找到使分类结
果最好的投影空间。最大化该准则的可以转化为求如下广义特征方程最大的特征值对应的特
征向量的问题
biw
SS
(13)
如果需要
dd D
个判别向量把样本降到 d 维,则取最大的 d 个特征值对应的特征向量。
我们把求得的这些用来投影的向量称为判别向量。如果
w
S 为可逆矩阵,则可以在式(13)两
边同时左乘
1
w
S
以简化计算。
因为
b
S 由 c 个秩为 1 的矩阵加和而成,并且其中只有 1c
个矩阵是独立的
(
1
0
c
ii
i
nm m
),所以
1
b
rank S c
。在各类样本均值相互独立的条件下取等号。
由于这一限制,求广义特征值的过程中我们最多能得到
1c
个非零的特征值。
Fisher 线性判别分析并不完美,存在诸多问题,下面我们从几个方面对这些问题进行阐
述并介绍现有的解决方案。
2.2 判别向量之间的相关性
如果只需一个判别向量,则取(13)式最大的个特征值对应的特征向量即可,因为在该向
量方向的投影具有最大的类间散布和类内散布的比值。需要
k 个判别向量时,选择(13)式前
k 个最大的非零特征值对应的特征向量作为判别向量并不一定是最优的,因为各个向量之间
会有相关性,这与 LDA 的初衷不符。LDA 的目的是降维,即消除一些冗余的数据,而在降
维的同时又引入了数据相关显然是不明智的。而向量之间的相关性可以从两个方面考虑
n 维空间向量本身固有的相关性
降维后各维数据之间的相关性
前者从几何上解释为两个判别向量夹角的大小。后者可以从概率上解释为降维两个特征的相
关程度。通过这两种相关性对判别向量做一定的限制可以求得在理论上更优的判别向量。
2.2.1 正交 LDA(FSLDA)
1975 年,Foley 和 Sammon 提出了一种适应于两类问题的 FSLDA 方法[3],利用此方法
得到的判别向量相互正交。1985 年,Okada 和 Tomita 提出了一种能计算出更多判别向量的
正交 LDA[4]。1988 年,Duchene 和 Leclercq 提出了一种空间变换方法,并在变换后的空间
中进行线性判别[5]。1993 年,Liu 等人在[6]中研究了 LDA 的解法。
正交 LDA 的目标是得出一组正交的判别向量,但对于第一个判别向量来说除了最大化 Fisher
准则外没有别的限制,所以第一个判别向量的计算方法同经典的 LDA,即 (13)式中最大的特
征值对应的特征向量。在得到
j
个判别向量
12
, ,...,
j
以后,求第
1j
个的判别向量的
目标函数和约束条件为
11
11
1
max
..
0 1,2,...,
T
T
jbj
b
TT
jwj w
T
ij
S
S
SS
st
ij
(14)
通过数学推导得到下一个判别向量为下式
1
11
12
...
jbi iwi
TT
jww
j
PS w S w
PIHHSHHS
H
(15)
最大的特征值对应的特征向量。
从该方法的计算步骤可以看出,其几何解释为:在已有判别向量的正交空间中求得使
Fisher 值最大的新判别向量。很明显每一步都要计算几次矩阵的逆和特征向量以及特征值,
为了克服这一问题,Song 提出了一种新的方法[7]。这种方法理论简单,并且易于计算。其
思想为:先用经典的 LDA 方法得到了
r 个判别向量
12
, ,...,
r
ww w,然后利用施密特正交化
的方法得到一组正交的判别向量,具体步骤如下:
11
1
11
1
11
T
k
ik
kk i
T
i
ii
vw
vw
vw vkr
vv
(16)
2.2.2 不相关的 LDA(ULDA)
2001 年,Jin 等基于概率论中数据相关性思想提出了不相关的 LDA[8][9]. 在介绍不相
关的 LDA 之前,我们先介绍如何量化投影后两个特征之间的相关性。样本
x
对应判别向量
i
和
j
的特征分别为
T
ii
yx
和
T
jj
yx
,它们的协方差定义为[10]:
cov ,
ij i i j j
yy E y Ey y Ey
(17)
根据协方差定义两者的相关性
cov ,
,
cov , cov ,
ij
ij
ii j j
T
itj
TT
iti jtj
yy
yy
y
yyy
S
SS
(18)
不相关 LDA 的对判别向量的限制:1、最大化 Fisher 准则值;2、用各个判别向量降维
后得到的特征之间相关性为零。为了满足这两个条件解法如下。与正交的 LDA 相同,此方
法的第一个判别向量仍然采用与经典的 LDA 相同的方法来计算。在得到
j
个判别向量
12
, ,...,
j
以后,求第
1j 个的判别向量的目标函数和约束条件为
11
11
1
max
..
0 1,2,...,
T
T
jbj
b
TT
jwj w
T
itj
S
S
SS
st
Sij
(19)
通过数学推导得到第
1j 个判别向量为下式
剩余35页未读,继续阅读
wutongxiyu2012
- 粉丝: 3
- 资源: 4
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- zigbee-cluster-library-specification
- JSBSim Reference Manual
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功