在jupyter中对数据集进行划分(使用sklearn中的train_test_split),求出测试集上的准确度
时间: 2023-05-12 08:04:41 浏览: 84
数据集分割train和test程序
可以使用以下代码对数据集进行划分,并计算测试集上的准确度:
```
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
# X为特征矩阵,y为标签向量
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 训练模型
model.fit(X_train, y_train)
# 预测测试集
y_pred = model.predict(X_test)
# 计算准确度
accuracy = accuracy_score(y_test, y_pred)
print("测试集准确度:", accuracy)
```
其中,`X`为特征矩阵,`y`为标签向量,`model`为训练好的模型。`train_test_split`函数将数据集划分为训练集和测试集,`test_size`参数指定测试集占总数据集的比例,`random_state`参数用于控制随机数种子,保证每次划分结果一致。`accuracy_score`函数用于计算准确度。
阅读全文