pca降维python案例
时间: 2024-07-17 22:01:30 浏览: 138
PCA(Principal Component Analysis,主成分分析)是一种常用的数据预处理技术,用于降低高维数据的维度并保持关键信息。在Python中,我们可以使用scikit-learn库来进行PCA操作。下面是一个简单的PCA降维案例:
```python
# 导入所需库
import numpy as np
from sklearn.decomposition import PCA
import matplotlib.pyplot as plt
# 创建一个模拟的高维数据集(假设我们有100个样本,每个样本有100个特征)
X = np.random.rand(100, 100)
# 实例化PCA对象,设置n_components参数为需要保留的主要成分数量,比如前95%
pca = PCA(n_components=0.95)
# 进行降维
X_pca = pca.fit_transform(X)
# 打印降维后的特征数量
print("Original dimensions:", X.shape)
print("Reduced dimensions:", X_pca.shape)
# 可视化原数据和降维后的数据分布
plt.scatter(X_pca[:, 0], X_pca[:, 1]) # 第一和第二主成分作为x和y轴
plt.xlabel('First Principal Component')
plt.ylabel('Second Principal Component')
plt.title('PCA Visualization')
plt.show()
阅读全文