使用决策树算法实现空气质量分类,提供代码以及注释
时间: 2023-06-04 07:04:39 浏览: 149
很高兴能为您提供代码,以下是使用决策树算法实现空气质量分类的示例代码。请注意,这只是伪代码,您需要根据您的具体数据和需求进行修改和优化。
# 导入需要的库和模块
from sklearn.tree import DecisionTreeClassifier # 导入决策树分类器
from sklearn.model_selection import train_test_split # 导入数据集分割函数
from sklearn.metrics import accuracy_score # 导入准确率计算函数
# 加载数据集,dataset为包含空气质量相关特征的数据集
X = dataset.drop('quality', axis=1)
y = dataset['quality']
# 数据集分割,将数据集分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 定义决策树模型并进行训练
dtc = DecisionTreeClassifier(random_state=42)
dtc.fit(X_train, y_train)
# 对测试集进行预测并计算准确率
y_pred = dtc.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print('Decision Tree Accuracy Score:', accuracy)
# 可以将决策树输出为图像
from sklearn.tree import export_graphviz
import pydotplus
from IPython.display import Image
dot_data = export_graphviz(dtc, out_file=None, feature_names=X.columns, class_names=['Good', 'Moderate', 'Unhealthy', 'Hazardous'], filled=True, rounded=True, special_characters=True)
graph = pydotplus.graph_from_dot_data(dot_data)
Image(graph.create_png())
阅读全文