线性判别分析(LDA)原理与应用

需积分: 0 198 浏览量更新于2024-08-05 收藏 918KB PDF 举报

"线性判别分析1" 线性判别分析（LDA，Linear Discriminant Analysis）是一种统计学方法，常用于特征选择和降维，特别是在分类任务中。它的核心目标是找出能最大化类别间差异同时最小化类别内差异的特征组合。与主成分分析（PCA）不同，LDA是一种有监督的学习方法，因为它利用了带有类别标签的数据。 1. LDA的基本思想 - 在LDA中，我们尝试找到一个或多个投影方向（例如，一维的w向量），使得投影后的数据能够最大程度地区分不同的类别。在二分类问题中，LDA的目标是找到一个直线（在二维空间）或超平面（在高维空间），使得两类样本在这个方向上的投影距离最大。 2. 二类情况下的LDA - 对于二类分类问题，LDA假设每个类别的样本遵循同一个多变量正态分布，并且不同类别的样本均值不同，但共享相同的协方差矩阵。通过找到最优的w向量，LDA可以使得类别间的散度最大化，同时保持类别内的散度最小。 3. 样本表示与计算 - 在二类LDA中，样本表示为d维的坐标点，分为两类，每类有各自的样本数量。LDA首先计算每类样本的均值，然后找到一个w向量，使得类间的散度（比如Fisher准则）最大。 4. Fisher准则 - Fisher准则（Fisher's Linear Discriminant）是LDA的关键，它衡量的是类间散度与类内散度之比。这个准则函数的优化结果就是w向量，使得投影后的数据点在新的坐标系中具有最大的类间距离和最小的类内距离。 5. 投影与决策边界 - 投影后的y值（即w^Tx）表示样本在新坐标系中的位置，它不再是0/1的类别标签，而是表示样本到原点的距离。在二维情况下，这个距离决定了样本落在哪个类别的一侧，从而形成决策边界。 6. LDA的限制 - LDA的一个显著限制是它最多只能生成C-1维的子空间，其中C是类别的数量。这意味着如果类别过多，降维的效果可能会受限。 7. 与回归的关系 - 虽然LDA主要用于分类问题，但它与回归分析也有联系。在某些情况下，LDA的投影结果可以用来预测连续变量，这在一定程度上与回归分析相类似，但主要区别在于LDA的目标是最大化类别区分而不是拟合数据。 8. 应用领域 - LDA广泛应用于模式识别、计算机视觉（如人脸识别）、文本分类等领域，它有效地减少了特征空间的维度，简化了模型复杂性，同时也保留了重要的分类信息。 9. 总结 - 线性判别分析通过考虑类别信息，提供了一种有效的特征选择和降维手段，尤其是在处理高维数据和分类任务时。然而，它也受到一些限制，如假设数据符合特定的概率分布，以及在多类别情况下的局限性。尽管如此，LDA仍然是数据分析和机器学习中一个重要的工具。

我们使用另外一个度量值，称作散列值（scatter），对投影后的类求散列值，如下









 󰇛



󰇜







从公式中可以看出，只是少除以样本数量的方差值，散列值的几何意义是样本点的密集

程度，值越大，越分散，反之，越集中。

而我们想要的投影后的样本点的样子是：不同类别的样本点越分开越好，同类的越聚集

越好，也就是均值差越大越好，散列值越小越好。正好，我们可以使用 J(w)和 S 来度量，最

终的度量公式是



󰇛



󰇜



































接下来的事就比较明显了，我们只需寻找使 J(w)最大的 w 即可。

先把散列值公式展开









 󰇛



󰇜







 󰇛











󰇜







 



󰇛



󰇜󰇛



󰇜









我们定义上式中中间那部分





 󰇛



󰇜󰇛



󰇜







这个公式的样子不就是少除以样例数的协方差矩阵么，称为散列矩阵（scatter matrices）

我们继续定义

















称为 Within-class scatter matrix。

那么回到上面







的公式，使用



替换中间部分，得













































然后，我们展开分子





称为 Between-class scatter，是两个向量的外积，虽然是个矩阵，但秩为 1。

那么 J(w)最终可以表示为

剩余11页未读，继续阅读

苏采

粉丝: 18
资源: 300

线性判别分析(LDA)原理与应用

线性判别分析LDA算法代码

LDA线性判别分析.ipynb

线性判别分析(LDA)入门

线性判别_判别分析_matlab_线性判别分析_线性判别_源码

贝叶斯线性判别分析LDA_lda_贝叶斯判别分析LDA_线性判别分析_slabsmml_

线性判别分析

LDA：线性判别分析：执行线性判别分析。-matlab开发

第三章-线性判别分析-非参数判别分类方法_非参数判别分类方法_线性判别分析_throwydd_线性判别_

lda线性判别分析分类_lda_分类器_线性判别分析_

FLDA-2020线性判别分析_flda_费舍尔_费舍尔线性_费舍尔线性判别分析F-LDA_降维_源码

最新资源