(三) 找个数据集,利用SKLearn库跑一个决策树模型; 1. 加载数据集,可以使用其它任何数据集,不局限于iris; 2. 划分数据集; #两种做法:1.分成训练集和测试集;2.采用K折交叉验证; 3. 选择一个分类模型(线性回归、svm等),自己编写,或网上下载,或调用sklearn库,进行训练; 4. 输出在测试集上的精度。
时间: 2023-05-31 08:03:17 浏览: 93
1. 加载数据集可以使用SKLearn自带的数据集,也可以使用其他公开的数据集,例如Kaggle上的数据集。在加载数据集后,需要对数据进行预处理,包括数据清洗、缺失值填充、特征工程等操作。
2. 划分数据集是为了将数据集分为训练集和测试集,用于模型的训练和评估。一般情况下,可以使用SKLearn库的train_test_split方法将数据集划分为训练集和测试集。在进行数据集划分时,需要注意训练集和测试集的比例,一般情况下训练集占总数据集的70%~80%左右,测试集占总数据集的20%~30%左右。
阅读全文