(三)找个数据集,利用SKLearn库跑一个决策树模型; 1.加载数据集,可以使用其它任何数据集,不局限于iris; 2.划分数据集; #两种做法:1.分成训练集和测试集;2.采用K折交叉验证; 3.选择一个分类模型(线性回归、svm等),自己编写,或网上下载,或调用sklearn库,进行训练; 4.输出在测试集上的精度。
时间: 2023-05-29 17:08:04 浏览: 98
机器学习与深度学习-通过决策树算法分类鸢尾花数据集iris求出错误率画出决策树并进行可视化(完整源码+文档)0.zip
1. 加载数据集:可以使用SKLearn库自带的数据集,也可以使用其他数据集。例如,我们可以使用UCI的鸢尾花数据集(Iris),通过SKLearn库中的load_iris()方法加载数据集:
```
from sklearn.datasets import load_iris
iris = load_iris()
X = iris.data
y = iris.target
```
2. 划分数据集:我们可以使用SKLearn库中的train_test_split()方法将数据集划分为训练集和测试集。
```
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
```
这里将数据集分为70%的训练集和30%的测试集,随机种子为42,可以保证每次运行代码得到相同的结果。
阅读全文