pca主成分分析python实际例子
时间: 2024-11-21 07:15:08 浏览: 17
PCA(Principal Component Analysis,主成分分析)是一种常用的维度ality reduction技术,在Python中可以使用sklearn库来进行操作。一个简单的例子是在处理图像数据集,如手写数字识别任务中,原始数据通常包含很多不必要的特征,如像素值的细微变化。通过PCA,我们可以找到数据的主要方向(即主成分),这些方向包含了最多的信息。
下面是一个使用sklearn进行PCA的基本步骤:
```python
from sklearn.decomposition import PCA
import numpy as np
import matplotlib.pyplot as plt
# 假设我们有一个二维的数据集,例如iris数据集的一部分
data = iris.data[:, :2] # 取前两个特征作为示例
print("Original data shape:", data.shape)
# 创建PCA对象并设置降维到2维
pca = PCA(n_components=2)
principal_components = pca.fit_transform(data)
# 新的数据形状应该只有两列,因为我们将维度降到了2
new_data_shape = principal_components.shape
print("Reduced data shape:", new_data_shape)
# 可视化原始数据和主成分
plt.scatter(principal_components[:, 0], principal_components[:, 1], c=iris.target)
plt.xlabel('First Principal Component')
plt.ylabel('Second Principal Component')
plt.title('PCA Visualization')
plt.show()
阅读全文