用决策树进行空气质量等级分类数据有:日期、AQI、质量等级、PM2.5、PM10、SO2、CO、NO2、O3,提供详细的代码和注释
时间: 2023-09-22 12:11:56 浏览: 53
以下是使用决策树进行空气质量等级分类的Python代码及注释:
```python
# 导入所需的库
import pandas as pd
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
# 读取数据集
data = pd.read_csv('air_quality.csv')
# 将质量等级转换为数值型变量
label_mapping = {'优': 1, '良': 2, '轻度污染': 3, '中度污染': 4, '重度污染': 5, '严重污染': 6}
data['质量等级'] = data['质量等级'].map(label_mapping)
# 将特征和标签分离
X = data.drop(['日期', '质量等级'], axis=1)
y = data['质量等级']
# 将数据集分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 构建决策树模型
model = DecisionTreeClassifier()
# 在训练集上训练模型
model.fit(X_train, y_train)
# 在测试集上进行预测
y_pred = model.predict(X_test)
# 计算模型的准确率
accuracy = accuracy_score(y_test, y_pred)
print('Accuracy:', accuracy)
```
代码中使用的数据集(air_quality.csv)应该包含日期、AQI、质量等级、PM2.5、PM10、SO2、CO、NO2、O3等列。在代码中,我们首先将质量等级转换为数值型变量,然后将特征和标签分离,并将数据集分为训练集和测试集。接着,我们使用sklearn库中的DecisionTreeClassifier类构建决策树模型,并在训练集上训练模型。最后,我们使用测试集进行预测,并计算模型的准确率。