将导入的boston数据集按7:3的比例拆份为训练集和测试集,分别输出训练 集和测试集中数据维度和标签维度
时间: 2024-10-23 12:04:57 浏览: 7
在Python中,我们通常使用`train_test_split`函数从scikit-learn库的`load_boston`数据集中分割数据。`Boston`数据集包含了波士顿房价的信息,它是一个回归问题的数据集。
首先,你需要导入所需的库并加载数据:
```python
from sklearn.datasets import load_boston
from sklearn.model_selection import train_test_split
import numpy as np
# 加载波士顿房价数据
boston = load_boston()
X = boston.data # 特征数据
y = boston.target # 目标变量(房价)
# 按照70%训练集和30%测试集的比例分割数据
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# 输出训练集和测试集的数据维度和标签维度
print(f"Training set:")
print(f"Dimensions: ({X_train.shape[0]}, {X_train.shape[1]}), Target dimensions: ({y_train.shape[0]})")
print("\nTest set:")
print(f"Dimensions: ({X_test.shape[0]}, {X_test.shape[1]}), Target dimensions: ({y_test.shape[0]})")
```
这将打印出训练集和测试集的样本数(第一维表示样本数,第二维表示特征数)以及对应的标签数。
阅读全文