PCA入门与去相关性详解：协方差矩阵与特征向量的应用

需积分: 33 180 浏览量更新于2024-09-12 收藏 39KB DOCX 举报

PCA（主成分分析）是一种常用的数据降维技术，在数据分析中被广泛应用于特征提取和数据可视化。以下是PCA的一些关键概念和步骤： 1. **协方差矩阵**：协方差矩阵是衡量一组随机变量之间线性关系的重要工具。对于一个n维随机变量X，协方差矩阵C是一个n×n的对称矩阵，其元素表示变量间的变化趋势。对于离散数据，通过计算每个维度上数据的均值来近似期望值，得到协方差的估计。 2. **均值归一化与协方差计算**：在实际应用中，对数据进行均值归零处理，即将每个维度上的观测数据减去该维度的均值，这有助于消除不同尺度带来的影响。协方差矩阵可以表示为观测数据矩阵Z的转置与Z相乘，即C = Z'Z，其中Z是对数数据矩阵。 3. **PCA变换**：PCA的目标是找到一个线性变换P，使得新的数据点在新坐标系中各维度之间相互独立，即协方差矩阵变为对角矩阵。通过对原始协方差矩阵进行特征值分解，可以找到正交的特征向量V，这些向量构成了新的坐标轴。特征值对应着原数据在新轴上的方差程度，对角化的协方差矩阵D由特征值构成。 4. **线性变换P的选择**：线性变换P由特征向量V的逆矩阵乘以特征值的平方根矩阵得到，即P=VΛ^(-1/2)，其中Λ是对角线元素为特征值的矩阵。通过这样的变换，使得新的数据点的新坐标（即P'Z）的协方差矩阵是对角化的，这意味着每个新的坐标轴（即主成分）只反映原始数据的一个独立成分。 5. **成分分析视角**：PCA可以从样本的维度去相关性或样本的线性分解两个方面理解。它揭示了数据在高维空间中的潜在结构，通过减少冗余和保留最重要的信息，使得数据在较低维度上仍然保持原有的主要特性。新基向量（P1到Pn）被称为主成分，它们是原始数据特征向量的标准化版本，反映了数据的主要变异方向。 PCA的核心在于利用统计学方法找出数据中最重要的特征，通过线性变换实现数据的降维，并保持大部分的信息含量。这一过程对于数据挖掘、机器学习和数据可视化等领域有着重要的应用价值。

1.协方差矩阵定义-期望值形式

n 维随机变量 X 的一次取值代表一次观测：

X =(x

… x

)

将其视为 n 个随机变量组成的向量，则定义协方差矩阵为

，其第 i 行，第 j 列元素为：

=Cov

(

, x

)

(

−E (x

)

∙

(

−E (x

)

(1)

显然有该矩阵为对称阵。综合可以得到此矩阵从向量 X 的计算式：

Σ=E

(

−E (x

)

−E (x

)

…

−E (x

)

−E(x

) x

−E(x

) … x

−E(x

))

)

(

X−E( X )

)

∙

(

X −E(X )

)

(2)

2.协方差矩阵的离散数据计算形式

对 X 的有限个观测应用上面的基本定义，需要用均值估计代替期望值：

假设进行了 M 次观测，则对第 i 个维度上得到的 M 个离散数据有：

E(x

)≈ μ

＝

∑

ˇx

其中

ˇx

代表第 k 个样本的第 i 维观测数据。不妨将各个维度上的观测数据都减去其自身的均值，得到均值

归零化后的观测数据：

=ˇx

−μ

再次用均值估计代替期望值有协方差定义为：

=Cov

(

, x

)

(

−E (x

)

∙

(

−E (x

)

≈

∑

则根据矩阵乘法规则，如果定义各维度均值归零化观测数据矩阵 Z（nxM 规格，第 i 行第 k 列数据为

），

则协方差矩阵为 nxn 规则，用 Z 表达为：

Σ=

Z Z

3.PCA 变换

从某种恒定概率模式信息源，观测到 N 个观测数据点(下式假定观测数据为二维，且各维均值都

归零过):

下载后可阅读完整内容，剩余5页未读，立即下载

ltqusst

粉丝: 0
资源: 2

PCA入门与去相关性详解：协方差矩阵与特征向量的应用

学习PCA收获

PCA主成分分析实验报告 （附MATLAB代码）.docx

CAN学习心得

CAN总线学习心得--重要

《机器学习实践》源码和《机器学习-算法原理与编程实践》源码以及学习心得.zip

模式识别实验3PCA1

线性代数的学习方法和心得体会.doc

机器学习的相关技术文档及心得

alone 心得共享

面试和算法心得

最新资源

PCA主成分分析实验报告（附MATLAB代码）.docx