1.葡萄酒数据集(wine.data)搜集了法国不同产区葡萄酒的化学指标。试建立决策树、随机森林2种分类器模型,比较各种分类器在此数据集上的效果。源文件命名为:“决策树与随机森林分类器.py”,分析文件命名为:“决策树与随机森林分类器.docx” 给出一串代码
时间: 2024-02-13 08:01:09 浏览: 196
以下是建立决策树和随机森林分类器的Python代码。
```python
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score
# 加载数据集
data = pd.read_csv('wine.data', header=None)
# 分离特征和标签
X = data.iloc[:, 1:]
y = data.iloc[:, 0]
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# 建立决策树分类器
dtc = DecisionTreeClassifier()
dtc.fit(X_train, y_train)
# 建立随机森林分类器
rfc = RandomForestClassifier(n_estimators=100)
rfc.fit(X_train, y_train)
# 对测试集进行预测
y_pred_dtc = dtc.predict(X_test)
y_pred_rfc = rfc.predict(X_test)
# 计算准确率
acc_dtc = accuracy_score(y_test, y_pred_dtc)
acc_rfc = accuracy_score(y_test, y_pred_rfc)
print('决策树分类器的准确率为:{:.2f}%'.format(acc_dtc * 100))
print('随机森林分类器的准确率为:{:.2f}%'.format(acc_rfc * 100))
```
在运行完上述代码后,会输出决策树分类器和随机森林分类器在测试集上的准确率。可以通过比较两者的准确率来评估它们在此数据集上的效果。
阅读全文