设置正确的超参数DT_classifier = tree.DecisionTreeClassifier(criterion='gini', max_depth=70)
时间: 2024-06-02 13:10:29 浏览: 209
Python库 | golicense_classifier-0.0.10.tar.gz
好的,你的第一个问题是如何设置正确的超参数DT_classifier。对于决策树分类器,有许多超参数可以调整,例如划分准则、最大深度、最小分裂样本等等。在这里,我们以划分准则和最大深度为例进行说明。
对于划分准则,决策树分类器一般有两种选择:基尼不纯度和信息熵。在这里,我们选择基尼不纯度作为划分准则,因为它在计算上比信息熵更快,而且在实际应用中效果也很好。
对于最大深度,它控制了树的复杂度,即树的深度。如果设置得太小,可能会欠拟合;如果设置得太大,可能会过拟合。在这里,我们设置最大深度为70,这是一个经验值,可以根据具体情况进行调整。
因此,正确的超参数设置应该是:DT_classifier = tree.DecisionTreeClassifier(criterion='gini', max_depth=70)。
阅读全文