导入数据集,使用`pandas`库的`read_csv`方法读取CSV格式的数据,并将数据集划分为训练集和测试集。
时间: 2023-11-21 20:11:24 浏览: 68
好的,我知道了。以下是代码示例:
```python
import pandas as pd
from sklearn.model_selection import train_test_split
# 使用read_csv方法读取CSV格式的数据
data = pd.read_csv('data.csv')
# 划分训练集和测试集,test_size表示测试集占总数据集的比例
train_data, test_data = train_test_split(data, test_size=0.2, random_state=42)
```
这里我假设数据文件名为`data.csv`,并且使用了`train_test_split`函数将数据集划分为训练集和测试集,其中`test_size`参数表示测试集占总数据集的比例,`random_state`参数是为了保证每次划分的结果都一样。在这个例子中,训练集占80%,测试集占20%。
阅读全文