jupyternotebook划分训练集和测试集
时间: 2024-01-02 17:22:57 浏览: 289
划分数据集为测试集、验证集、训练集
在Jupyter Notebook中划分训练集和测试集可以使用sklearn库中的train_test_split函数。下面是一个示例代码:
```python
from sklearn.model_selection import train_test_split
# 假设你有一个特征矩阵X和一个目标向量y
X = ...
y = ...
# 划分训练集和测试集,test_size表示测试集所占比例
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```
上述代码将特征矩阵X和目标向量y划分为训练集(X_train和y_train)和测试集(X_test和y_test),其中测试集占总数据的20%。你可以根据自己的需求调整test_size参数来控制测试集的比例。另外,random_state参数用于设置随机种子,保证每次划分的结果一致。
阅读全文