python 主成分分析 语言代码
时间: 2023-05-16 21:03:01 浏览: 311
Python 主成分分析(PCA)语言代码使用 scikit-learn 库提供的 PCA 类。首先,导入所需的库和数据集。然后,使用 PCA 类创建一个实例对象。通过调用 fit_transform 方法,使用数据集拟合 PCA 模型并将其转换为一个新的特征向量空间。最后,可以通过访问 PCA 实例对象的成分属性来查看每个主成分的方差贡献率。
以下是一个示例代码:
```python
import numpy as np
import pandas as pd
from sklearn.decomposition import PCA
#导入数据集
df = pd.read_csv('data.csv')
#将数据集中的特征数据作为矩阵输入到PCA模型中
X = df.drop('target', axis=1).values
#创建PCA实例对象
pca = PCA(n_components=3)
#使用数据集拟合PCA模型并将数据转换为新的特征向量空间
principalComponents = pca.fit_transform(X)
#查看每个主成分的方差贡献率
print(pca.explained_variance_ratio_)
```
在该示例代码中,数据集作为一个 pandas DataFrame 对象被加载并准备成 Numpy 矩阵 X,其中目标变量被删除,因为 PCA 旨在处理特征数据。然后,PCA 类被创建,其中 n_components 参数设置为 3,这意味着最终的转换维数将为 3。PCA 模型使用 fit_transform 方法对 X 进行拟合,并使用实例 principalComponents 存储那 3 个主成分。最后,pca.explained_variance_ratio_ 属性返回一个数组,每个值表示 PC 的相对方差贡献率。