首页用pandas库将数据集化为0.8训练集 0.2测试集的代码

用pandas库将数据集化为0.8训练集 0.2测试集的代码

时间: 2024-10-10 07:07:05 浏览: 31

使用Pandas库生成训练集和测试集通常涉及随机划分数据。假设你的数据存储在一个名为`data`的DataFrame中，你可以按照以下步骤操作： ```python import pandas as pd from sklearn.model_selection import train_test_split # 假设你的数据集中有特征列（X）和目标变量（y） X = data.drop('target_column', axis=1) # 将'target_column'替换为你的目标列名 y = data['target_column'] # 划分数据集 train_X, test_X, train_y, test_y = train_test_split(X, y, test_size=0.2, random_state=42) # 创建新的DataFrame，分别保存训练集和测试集 train_df = pd.DataFrame({'features': train_X, 'target': train_y}) test_df = pd.DataFrame({'features': test_X, 'target': test_y}) # 保存到csv文件 train_df.to_csv('train_data.csv', index=False) test_df.to_csv('test_data.csv', index=False)

阅读全文

CSDN会员

开通CSDN年卡参与万元壕礼抽奖

海量 VIP免费资源千本正版电子书商城会员专享价千门课程&专栏

全年可省5,000元立即开通全年可省5,000元立即开通