训练集 测试集划分代码
时间: 2023-09-04 09:13:32 浏览: 35
以下是一个简单的 Python 代码示例,用于将数据集分为训练集和测试集:
```python
import random
# 假设我们有一个包含数据的列表
data = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
# 将数据集分为训练集和测试集的比例
train_split = 0.8
# 计算训练集的大小
train_size = int(len(data) * train_split)
# 随机选择训练集的索引
train_indexes = set(random.sample(range(len(data)), train_size))
# 训练集和测试集的列表
train_data = []
test_data = []
# 遍历数据集并将其添加到训练集或测试集中
for i, item in enumerate(data):
if i in train_indexes:
train_data.append(item)
else:
test_data.append(item)
# 打印训练集和测试集
print("训练集:", train_data)
print("测试集:", test_data)
```
这是一个简单的例子,你可以根据你的数据集和需求进行修改。
相关问题
训练集测试集划分代码
训练集和测试集的划分可以使用不同的方法,下面是三个方法的示例代码:
方法一:
```python
from sklearn.model_selection import train_test_split
# 将数据按3:1划分为训练集和测试集,特征和标签按顺序自动对应
x_train, x_test, y_train, y_test = train_test_split(feature_data, label_data, test_size=0.25)
```
= record
else:
train.setdefault(user, {})
train[user][item = record
return train, test
trainData, testData = splitData(data, 4, 23)
```
划分训练集和测试集代码
可以使用sklearn库中的train_test_split函数来划分训练集和测试集,代码如下:
```
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```
其中,X为特征矩阵,y为标签向量,test_size表示测试集占总数据集的比例,random_state为随机种子,用于保证每次划分的结果一致。