(三)找个数据集,利用SKLearn库跑一个决策树模型; 1.加载数据集,可以使用其它任何数据集,不局限于iris; 2.划分数据集; #两种做法:1.分成训练集和测试集;2.采用K折交叉验证; 3.选择一个分类模型(线性回归、svm等),自己编写,或网上下载,或调用sklearn库,进行训练; 4.输出在测试集上的精度。
时间: 2023-05-29 07:08:04 浏览: 93
基于iris数据集进行四种机器学习算法(决策树、朴素贝叶斯、随机森林、支持向量机SVM)的训练,使用交叉检验(Cross-val
1. 加载数据集:可以使用SKLearn库自带的数据集,也可以使用其他数据集。例如,我们可以使用UCI的鸢尾花数据集(Iris),通过SKLearn库中的load_iris()方法加载数据集:
```
from sklearn.datasets import load_iris
iris = load_iris()
X = iris.data
y = iris.target
```
2. 划分数据集:我们可以使用SKLearn库中的train_test_split()方法将数据集划分为训练集和测试集。
```
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
```
这里将数据集分为70%的训练集和30%的测试集,随机种子为42,可以保证每次运行代码得到相同的结果。
阅读全文