生成代码加载diabetes糖尿病数据集,使用PCA主成分分析方法,参数n_components=8生成数据降维规则,将规则分别用于训练集和测试集,分别输出PCA降维前训练数据和测试数据的形状, PCA降维后训练数据和测试数据的形状
时间: 2023-07-14 18:12:56 浏览: 92
以下是生成代码:
```python
from sklearn.datasets import load_diabetes
from sklearn.decomposition import PCA
from sklearn.model_selection import train_test_split
# 加载糖尿病数据集
diabetes = load_diabetes()
X = diabetes.data
y = diabetes.target
# 分割数据集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# PCA降维
pca = PCA(n_components=8)
X_train_pca = pca.fit_transform(X_train)
X_test_pca = pca.transform(X_test)
# 输出降维前的训练数据和测试数据的形状
print("降维前训练数据的形状:", X_train.shape)
print("降维前测试数据的形状:", X_test.shape)
# 输出降维后的训练数据和测试数据的形状
print("降维后训练数据的形状:", X_train_pca.shape)
print("降维后测试数据的形状:", X_test_pca.shape)
```
输出结果如下:
```
降维前训练数据的形状: (353, 10)
降维前测试数据的形状: (89, 10)
降维后训练数据的形状: (353, 8)
降维后测试数据的形状: (89, 8)
```
可以看到,原始数据集中有10个特征,经过PCA降维后,训练数据和测试数据分别变成了8维。
阅读全文