决策树分类器代码实现
时间: 2024-09-04 18:04:09 浏览: 70
Matlab实现决策树算法
决策树是一种常用的机器学习算法,用于分类和回归问题。它通过构建一系列规则来进行预测,类似于树状结构,每个内部节点代表一个特征测试,分支表示结果,叶子节点给出类别预测。这里是一个简单的Python Scikit-learn库中决策树分类器(DecisionTreeClassifier)的基本实现示例:
```python
from sklearn import tree
import pandas as pd
import numpy as np
# 假设我们有一个数据集df,包含特征列X和目标列y
data = pd.read_csv('your_dataset.csv') # 替换为实际文件路径
X = data.drop('target_column', axis=1) # 'target_column'是目标变量
y = data['target_column']
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 创建并拟合决策树模型
clf = tree.DecisionTreeClassifier() # 使用默认参数
clf.fit(X_train, y_train)
# 预测
predictions = clf.predict(X_test)
# 打印一些统计信息,如准确率
print("Accuracy:", accuracy_score(y_test, predictions))
```
这个例子中,首先导入所需的库,然后加载数据,划分训练集和测试集。接着创建`DecisionTreeClassifier`实例,对训练集进行拟合,最后进行预测并计算模型的准确性。
阅读全文