train_test_split 怎么使用 请用代码演示
时间: 2023-07-20 20:06:23 浏览: 44
`train_test_split` 是 Scikit-learn 中的一个函数,用于将数据集划分为训练集和测试集。
以下是使用 `train_test_split` 的示例代码:
```python
from sklearn.model_selection import train_test_split
import numpy as np
# 创建一个 10 x 2 的随机数组作为特征
X = np.random.rand(10, 2)
# 创建一个长度为 10 的随机数组作为标签
y = np.random.randint(0, 2, 10)
# 将数据集划分为训练集和测试集,其中测试集占比为 0.3
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)
# 打印训练集和测试集的大小
print("Training set size:", len(X_train))
print("Test set size:", len(X_test))
```
输出结果如下:
```
Training set size: 7
Test set size: 3
```
在这个示例中,我们使用 `train_test_split` 将数据集 `X` 和标签 `y` 划分为了训练集和测试集,其中测试集占比为 0.3。最后我们打印了训练集和测试集的大小。
相关问题
train_test——split
train_test_split 是一个常用的函数,用于将数据集划分为训练集和测试集。这个函数可以帮助我们评估机器学习模型的性能。
在Python中,可以使用 scikit-learn 库中的 train_test_split 函数来实现数据集的划分。该函数接受多个参数,其中最重要的是要划分的数据集和测试集的比例。
下面是一个示例代码,演示了如何使用 train_test_split 函数:
``` python
from sklearn.model_selection import train_test_split
# 假设有一个特征矩阵 X 和目标向量 y
X = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
y = [1, 2, 3]
# 将数据集划分为训练集和测试集,测试集占比为 0.2
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
# 打印划分后的训练集和测试集
print("训练集 X:", X_train)
print("训练集 y:", y_train)
print("测试集 X:", X_test)
print("测试集 y:", y_test)
```
在上述代码中,我们将特征矩阵 X 和目标向量 y 划分成了训练集和测试集。测试集的大小占总数据集大小的 0.2(20%)。
注意,train_test_split 函数还有其他可选参数,例如 random_state 参数,用于设置随机种子,以确保每次划分的结果一致。
希望这个示例能够帮助你理解 train_test_split 函数的用法!如果还有其他问题,请随时提问。
from sklearn.model_selection import train_test_split train, test = train_test_split(data, test_size=0.2, random_state=42,)
sklearn.model_selection.train_test_split函数是一个用于将数据集划分为训练集和测试集的函数[^1]。通过导入该函数,你可以使用train_test_split函数将数据集划分为训练集和测试集[^2]。
下面是一个示例代码,演示了如何使用train_test_split函数将数据集划分为训练集和测试集:
```python
from sklearn.model_selection import train_test_split
# 假设你的数据集是一个名为data的变量
train, test = train_test_split(data, test_size=0.2, random_state=42)
```
在这个示例中,train_test_split函数将数据集data划分为训练集和测试集,其中测试集的大小占总数据集的20%。random_state参数用于设置随机种子,以确保每次运行代码时得到相同的划分结果。