决策树算法python sklearn
时间: 2023-06-30 13:12:51 浏览: 111
决策树是一种常用的机器学习算法,它可以用于分类和回归问题。在Python中,我们可以使用scikit-learn库中的DecisionTreeClassifier和DecisionTreeRegressor类来构建决策树模型。
首先,我们需要导入相关库和数据集:
```python
from sklearn.datasets import load_iris
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
iris = load_iris()
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.3, random_state=42)
```
然后,我们可以创建一个DecisionTreeClassifier对象,并使用fit方法拟合模型:
```python
clf = DecisionTreeClassifier(random_state=42)
clf.fit(X_train, y_train)
```
我们可以使用score方法来评估模型在测试集上的表现:
```python
print(clf.score(X_test, y_test))
```
如果我们想要可视化决策树,我们可以使用Graphviz库和export_graphviz函数:
```python
from sklearn.tree import export_graphviz
import graphviz
dot_data = export_graphviz(clf, out_file=None, feature_names=iris.feature_names, class_names=iris.target_names, filled=True, rounded=True, special_characters=True)
graph = graphviz.Source(dot_data)
graph.render("iris")
```
这将生成一个名为“iris.pdf”的PDF文件,其中包含可视化的决策树。
以上就是使用Python的scikit-learn库实现决策树算法的基本步骤。
阅读全文