请写一段代码将xls格式的表格划分为训练集和测试集,并将其保存
时间: 2024-09-24 18:24:31 浏览: 38
贝叶斯网络java代码及训练集测试集_贝叶斯网络_测试集_
5星 · 资源好评率100%
在Python中,我们可以使用pandas库处理Excel文件,然后通过sklearn库的train_test_split函数将其划分为训练集和测试集。这里是一个简单的示例,假设你已经有了一个名为"data.xlsx"的Excel文件:
```python
import pandas as pd
from sklearn.model_selection import train_test_split
# 加载数据
df = pd.read_excel('data.xlsx')
# 假设你的数据集有两列,一列是特征X,另一列是目标变量y
X = df.drop('target_column', axis=1) # 替换 'target_column' 为你需要的目标列名
y = df['target_column']
# 划分训练集和测试集,默认比例为70%用于训练,30%用于测试
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# 将数据集保存为新的Excel文件
train_data = pd.concat([pd.DataFrame(X_train), pd.DataFrame(y_train)], axis=1)
test_data = pd.concat([pd.DataFrame(X_test), pd.DataFrame(y_test)], axis=1)
train_data.to_excel('train_data.xlsx', index=False)
test_data.to_excel('test_data.xlsx', index=False)
阅读全文