随机森林预测的python代码,多个特征变量,一个预测结果,包括精度混淆矩阵图
时间: 2023-07-13 11:14:56 浏览: 109
以下是一个使用随机森林进行预测的Python代码示例,其中包括多个特征变量和一个预测结果,并且涵盖了精度混淆矩阵图的绘制:
```python
# 导入需要使用的库
import pandas as pd
import numpy as np
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import confusion_matrix
import seaborn as sns
import matplotlib.pyplot as plt
# 读取数据集
data = pd.read_csv('data.csv')
# 定义自变量和因变量
X = data.iloc[:, :-1].values
y = data.iloc[:, -1].values
# 将数据集分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
# 定义随机森林分类器
classifier = RandomForestClassifier(n_estimators=100, random_state=0)
# 在训练集上训练分类器
classifier.fit(X_train, y_train)
# 在测试集上进行预测
y_pred = classifier.predict(X_test)
# 计算预测精度并输出
accuracy = classifier.score(X_test, y_test)
print("Accuracy:", accuracy)
# 计算混淆矩阵并绘制热力图
cm = confusion_matrix(y_test, y_pred)
sns.heatmap(cm, annot=True, cmap="Blues")
plt.show()
```
在这个代码示例中,我们首先导入了需要使用的库,并读取了包含自变量和因变量的数据集。然后,我们将数据集分为训练集和测试集,并定义了一个包含100个决策树的随机森林分类器。我们使用训练集来拟合分类器,并在测试集上进行预测。最后,我们计算了预测精度并输出,以及绘制了混淆矩阵的热力图。
需要注意的一点是,这个代码示例中使用的数据集并没有给出,需要根据自己的需求进行相应修改。
阅读全文