将csv文件划分训练集和测试集且不进行打乱
时间: 2023-09-06 20:11:01 浏览: 99
划分数据集为测试集、验证集、训练集
如果要将一个csv文件划分为训练集和测试集,且不进行打乱,可以采取以下步骤:
1. 读取csv文件,并将其转换为pandas数据帧。
```python
import pandas as pd
# 读取csv文件
df = pd.read_csv('data.csv')
```
2. 根据需要的训练集和测试集大小,计算出分割点的位置。
```python
train_size = 0.8 # 训练集占比
split_index = int(len(df) * train_size) # 分割点的位置
```
3. 根据分割点,将数据集划分为训练集和测试集。
```python
train_df = df[:split_index] # 训练集
test_df = df[split_index:] # 测试集
```
以上代码会将数据集的前80%作为训练集,后20%作为测试集。如果需要调整训练集和测试集的占比,只需要修改train_size的值即可。
阅读全文