用sklearn库中的train_test_split函数来实现数据集的分割。
时间: 2023-08-13 08:55:06 浏览: 88
Python分割训练集和测试集的方法示例
好的,下面是使用`sklearn`库中的`train_test_split`函数将数据集随机分割为训练集和测试集的示例代码:
```python
from sklearn.model_selection import train_test_split
# 假设你有一个特征矩阵X和一个目标向量y,表示你的数据集
# 使用 train_test_split 函数将数据集分割成训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# 打印分割后的数据集大小
print("训练集样本数:", X_train.shape[0])
print("测试集样本数:", X_test.shape[0])
```
在上述代码中,`X`是特征矩阵,`y`是目标向量。`test_size`参数指定了测试集所占的比例,这里设置为0.3表示将数据集按照7:3的比例分割为训练集和测试集。`random_state`参数用于设置随机种子,保证每次运行代码时得到的分割结果都相同。
分割后的训练集和测试集分别存储在`X_train`, `X_test`, `y_train`, `y_test`中。你可以根据自己的需求使用这些数据进行模型训练和性能评估。
阅读全文