将数据集划分为训练集和测试集 提示:使用sklearn中的train_test_split()函数 参考代码:train_set, test_set = train_test_split(housing, test_size=0.2, random_state=42)
时间: 2024-04-04 11:27:06 浏览: 54
python 划分数据集为训练集和测试集的方法
将数据集划分为训练集和测试集是机器学习中常用的一种方法,可以用来评估模型的性能。在Python中,可以使用sklearn库中的train_test_split()函数来实现数据集的划分。下面是一个示例代码:
```python
from sklearn.model_selection import train_test_split
# 假设housing是你的数据集
train_set, test_set = train_test_split(housing, test_size=0.2, random_state=42)
```
上述代码中,train_test_split()函数将housing数据集划分为训练集和测试集,其中test_size参数指定了测试集所占的比例,这里设置为0.2表示测试集占总数据集的20%。random_state参数用于设置随机种子,保证每次划分的结果一致。
阅读全文