将数据集分成训练集和测试集并分别保存成为csv文件的代码
时间: 2024-05-02 12:23:41 浏览: 285
数据集包括训练集和测试集
以下是将数据集分成训练集和测试集并分别保存为csv文件的Python代码示例:
```python
import pandas as pd
from sklearn.model_selection import train_test_split
# 读取原始数据集
data = pd.read_csv('original_dataset.csv')
# 将数据集分成训练集和测试集,其中test_size表示测试集所占比例,random_state表示随机种子,保证每次划分结果一致
train_data, test_data = train_test_split(data, test_size=0.2, random_state=42)
# 将训练集和测试集分别保存为csv文件
train_data.to_csv('train_data.csv', index=False)
test_data.to_csv('test_data.csv', index=False)
```
其中,我们使用了pandas库读取原始数据集,并使用sklearn库中的train_test_split函数将数据集划分成训练集和测试集。接着,我们使用to_csv函数将训练集和测试集分别保存为csv文件,其中参数index=False表示不保存行索引。
阅读全文