首页训练集测试集划分代码

训练集测试集划分代码

时间: 2023-09-04 08:13:32 浏览: 79

划分训练集和测试集示例代码 python

划分训练集和测试集在这个示例中，我们使用train_test_split方法将数据集划分为训练集和测试集，并指定了测试集大小的比例和随机数种子。该方法会返回4个元素，分别表示训练集的特征数据、测试集的特征数据、训练集的目标数据和测试集的目标数据。需要注意的是，在实际使用过程中，我们需要根据具体的应用场景选择合适的划分方法，并根据需求对训练集和测试集进行进一步处理。

以下是一个简单的 Python 代码示例，用于将数据集分为训练集和测试集： ```python import random # 假设我们有一个包含数据的列表 data = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10] # 将数据集分为训练集和测试集的比例 train_split = 0.8 # 计算训练集的大小 train_size = int(len(data) * train_split) # 随机选择训练集的索引 train_indexes = set(random.sample(range(len(data)), train_size)) # 训练集和测试集的列表 train_data = [] test_data = [] # 遍历数据集并将其添加到训练集或测试集中 for i, item in enumerate(data): if i in train_indexes: train_data.append(item) else: test_data.append(item) # 打印训练集和测试集 print("训练集:", train_data) print("测试集:", test_data) ``` 这是一个简单的例子，你可以根据你的数据集和需求进行修改。

阅读全文