决策树建模python代码
时间: 2025-01-21 17:24:10 浏览: 29
Python 决策树建模示例
导入必要的库
为了构建决策树模型,首先需要导入所需的Python库:
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score, classification_report
加载数据集并预处理
假设有一个Iris鸢尾花数据集作为例子,加载该数据集并对数据进行初步处理。
from sklearn.datasets import load_iris
# 载入 Iris 数据集
data = load_iris()
X = data.data # 特征变量
y = data.target # 目标标签
# 将数据分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
构建决策树模型
创建一个基于CART算法的分类器实例,并利用训练数据对其进行拟合。
clf = DecisionTreeClassifier(criterion='gini') # 使用基尼指数作为标准
clf.fit(X_train, y_train)
# 预测测试集的结果
y_pred = clf.predict(X_test)
模型评估
通过classification_report
函数可以获取详细的性能报告,这有助于理解不同类别上的表现情况[^1]。
print("Accuracy:", accuracy_score(y_test, y_pred))
print("\nClassification Report:")
print(classification_report(y_test, y_pred))
上述代码展示了完整的流程,从准备环境到最终得到预测结果以及相应的评价指标。这里特别强调的是,在选择分裂属性时采用了基尼指数这一准则,这是 CART 算法的特点之一[^2]。
相关推荐
















