主成分分析python实现代码
时间: 2024-09-24 20:18:26 浏览: 51
主成分分析(Principal Component Analysis,PCA)是一种常用的数据降维技术,它通过线性变换将原始数据转换到新的坐标系,新坐标系的方向由数据的方差最大方向确定。在Python中,我们可以使用scikit-learn库方便地实现PCA。下面是一个简单的例子:
```python
from sklearn.decomposition import PCA
import numpy as np
# 假设我们有如下的二维数据集
data = np.random.rand(100, 2) # 100个样本,每个样本有两个特征
# 创建PCA对象
pca = PCA()
# 对数据进行主成分分析
transformed_data = pca.fit_transform(data)
# 可视化前两个主成分
import matplotlib.pyplot as plt
plt.scatter(transformed_data[:, 0], transformed_data[:, 1])
plt.xlabel('First Principal Component')
plt.ylabel('Second Principal Component')
plt.show()
# 获取解释的方差比例
explained_variance_ratio_ = pca.explained_variance_ratio_
print("Explained variance ratio:", explained_variance_ratio_)
```
在这个代码中,`fit_transform()`方法同时进行了训练(计算主成分)和转换(应用到数据上),返回的是降维后的数据。`explained_variance_ratio_`则展示了各主成分对总变异性的贡献。
阅读全文