python 主成分分析求解
时间: 2023-10-12 12:21:08 浏览: 112
主成分分析(PCA)是一种常用的数据降维方法,可以通过对原始数据进行线性变换来提取数据中的主要特征,并将其转换为新的低维度空间,以便进行更高效的数据分析和可视化。
下面是Python中使用sklearn库进行主成分分析的示例代码:
1. 导入库和数据集
```python
from sklearn.datasets import load_iris
from sklearn.decomposition import PCA
iris = load_iris()
X = iris.data
y = iris.target
```
2. 创建PCA对象
```python
pca = PCA(n_components=2)
```
这里指定了n_components=2,即将原始数据转换为二维空间。
3. 训练PCA模型并进行数据转换
```python
X_pca = pca.fit_transform(X)
```
4. 可视化转换后的数据
```python
import matplotlib.pyplot as plt
plt.scatter(X_pca[:, 0], X_pca[:, 1], c=y)
plt.xlabel('First principal component')
plt.ylabel('Second principal component')
plt.show()
```
这里使用matplotlib库对转换后的数据进行散点图可视化,其中不同颜色代表不同的类别。
完整的主成分分析示例代码如下:
```python
from sklearn.datasets import load_iris
from sklearn.decomposition import PCA
import matplotlib.pyplot as plt
iris = load_iris()
X = iris.data
y = iris.target
pca = PCA(n_components=2)
X_pca = pca.fit_transform(X)
plt.scatter(X_pca[:, 0], X_pca[:, 1], c=y)
plt.xlabel('First principal component')
plt.ylabel('Second principal component')
plt.show()
```
阅读全文