python 读取csv文件 将数据划分为测试集和数据集
时间: 2023-10-02 19:07:35 浏览: 136
python中如何实现将数据分成训练集与测试集的方法
可以使用Python中的pandas库来读取csv文件并进行数据划分。以下是一个示例代码:
```python
import pandas as pd
from sklearn.model_selection import train_test_split
# 读取csv文件
data = pd.read_csv('data.csv')
# 将数据划分为训练集和测试集,其中test_size表示测试集所占的比例
train_data, test_data = train_test_split(data, test_size=0.2)
# 输出训练集和测试集的大小
print('训练集大小:', len(train_data))
print('测试集大小:', len(test_data))
```
在上面的代码中,我们首先使用pandas库中的read_csv()函数读取csv文件,并将其存储在一个名为data的变量中。
然后,我们使用sklearn库中的train_test_split()函数将数据划分为训练集和测试集。其中test_size参数指定了测试集所占的比例。在这个例子中,我们将测试集设置为总数据集的20%。
最后,我们输出了训练集和测试集的大小。
阅读全文