PCA变换python代码
时间: 2024-12-18 15:31:58 浏览: 16
PCA_PythonPCA_
PCA(主成分分析),是一种常用的数据降维技术,它通过线性变换将高维度数据转换到低维度空间,同时保留数据的主要信息。在Python中,我们可以使用sklearn库中的PCA模块来实现PCA变换。下面是一个简单的例子:
```python
from sklearn.decomposition import PCA
import numpy as np
# 假设我们有一个二维数据集df,其中包含两列特征
data = df.values
# 创建PCA对象,n_components设定为要保留的主成分数目(例如50%方差解释)
pca = PCA(n_components=0.95) # 选择解释95%方差的主成分
# 对数据进行PCA变换
transformed_data = pca.fit_transform(data)
# 可视化原始数据和降维后的数据
print("Original dimensions:", data.shape)
print("Reduced dimensions:", transformed_data.shape)
# 获取各主成分的方差贡献率
explained_variance_ratio_ = pca.explained_variance_ratio_
print("Explained variance ratio:", explained_variance_ratio_)
```
在这个例子中,`fit_transform()`函数同时进行了PCA模型的训练(即找到最大化方差的方向)和数据的转换。`explained_variance_ratio_`属性给出了每个主成分解释原始方差的比例。
阅读全文