pca计算公式 标准化
时间: 2023-05-30 18:07:40 浏览: 119
PCA算法标准化
PCA(主成分分析)的计算公式如下:
1. 标准化数据
将原始数据标准化使其均值为0,标准差为1,公式为:
$${z_{ij}} = \frac{{{x_{ij}} - \bar x_j}}{s_j}$$
其中,$z_{ij}$是标准化后的第i个样本在第j个特征上的取值,$x_{ij}$是原始数据的第i个样本在第j个特征上的取值,$\bar x_j$是第j个特征的均值,$s_j$是第j个特征的标准差。
2. 计算协方差矩阵
对标准化后的数据求协方差矩阵,公式为:
$$Cov(X) = \frac{1}{n-1}Z^TZ$$
其中,$n$是样本数量,$Z$是标准化后的数据矩阵。
3. 计算特征值和特征向量
对协方差矩阵进行特征值分解,得到特征值和特征向量,公式为:
$$Cov(X)v_i = \lambda_iv_i$$
其中,$v_i$是第i个特征向量,$\lambda_i$是第i个特征值。
4. 选择主成分
根据特征值的大小选择前$k$个主成分,其中$k$是主成分的数量。
5. 计算主成分得分
将标准化后的数据乘以前$k$个主成分的特征向量,得到主成分得分,公式为:
$${T_k} = Z{V_k}$$
其中,$T_k$是前$k$个主成分的得分,$V_k$是前$k$个主成分的特征向量。
阅读全文