python利用PCA进行主成分分析
时间: 2023-09-04 15:08:00 浏览: 112
PCA(Principal Component Analysis,主成分分析)是一种常用的数据降维技术,可以用于降低数据维度、去除数据冗余、提取数据主要特征等。下面我们就来介绍如何利用Python进行PCA主成分分析。
首先,需要导入相应的库:
```python
import numpy as np
import pandas as pd
from sklearn.decomposition import PCA
```
然后我们可以读取数据,这里以iris数据集为例:
```python
df = pd.read_csv('iris.csv')
X = df.iloc[:, :-1].values
```
其中,`iloc`函数用于根据行列索引获取数据,`:-1`表示取除了最后一列外的所有列的数据,这些数据就是我们需要进行PCA的数据。`values`属性表示将数据转换为numpy数组。
接下来,我们可以进行PCA分析:
```python
pca = PCA(n_components=2)
X_pca = pca.fit_transform(X)
```
这里我们指定了`n_components=2`,表示我们希望将数据降到2维。`fit_transform`函数表示对数据进行拟合和转换,返回转换后的数据。
最后,我们可以将转换后的数据进行可视化:
```python
import matplotlib.pyplot as plt
plt.scatter(X_pca[:,0], X_pca[:,1])
plt.show()
```
这里我们使用`scatter`函数绘制散点图,横坐标是第一维数据,纵坐标是第二维数据。
完整代码如下:
```python
import numpy as np
import pandas as pd
from sklearn.decomposition import PCA
import matplotlib.pyplot as plt
df = pd.read_csv('iris.csv')
X = df.iloc[:, :-1].values
pca = PCA(n_components=2)
X_pca = pca.fit_transform(X)
plt.scatter(X_pca[:,0], X_pca[:,1])
plt.show()
```
希望对您有所帮助!
阅读全文