首页(三) 找个数据集，利用SKLearn库跑一个决策树模型； 1. 加载数据集，可以使用其它任何数据集，不局限于iris； 2. 划分数据集； #两种做法：1.分成训练集和测试集；2.采用K折交叉验证； 3. 选择一个分类模型（线性回归、svm等），自己编写，或网上下载，或调用sklearn库，进行训练； 4. 输出在测试集上的精度。

(三) 找个数据集，利用SKLearn库跑一个决策树模型； 1. 加载数据集，可以使用其它任何数据集，不局限于iris； 2. 划分数据集； #两种做法：1.分成训练集和测试集；2.采用K折交叉验证； 3. 选择一个分类模型（线性回归、svm等），自己编写，或网上下载，或调用sklearn库，进行训练； 4. 输出在测试集上的精度。

时间: 2023-05-31 08:03:17 浏览: 93

1. 加载数据集可以使用SKLearn自带的数据集，也可以使用其他公开的数据集，例如Kaggle上的数据集。在加载数据集后，需要对数据进行预处理，包括数据清洗、缺失值填充、特征工程等操作。 2. 划分数据集是为了将数据集分为训练集和测试集，用于模型的训练和评估。一般情况下，可以使用SKLearn库的train_test_split方法将数据集划分为训练集和测试集。在进行数据集划分时，需要注意训练集和测试集的比例，一般情况下训练集占总数据集的70%~80%左右，测试集占总数据集的20%~30%左右。

阅读全文