随机森林预测的python代码,多个特征变量,一个预测结果,输入是excel表,包括精度混淆矩阵图
时间: 2024-02-16 16:03:17 浏览: 87
随机森林,随机森林算法,Python
5星 · 资源好评率100%
以下是一个使用随机森林进行预测的Python代码示例,其中包括多个特征变量和一个预测结果,并且输入数据是Excel表格,并且涵盖了精度混淆矩阵图的绘制:
```python
# 导入需要使用的库
import pandas as pd
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import confusion_matrix
import seaborn as sns
import matplotlib.pyplot as plt
# 读取Excel表格
data = pd.read_excel('data.xlsx')
# 定义自变量和因变量
X = data.iloc[:, :-1].values
y = data.iloc[:, -1].values
# 将数据集分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
# 定义随机森林分类器
classifier = RandomForestClassifier(n_estimators=100, random_state=0)
# 在训练集上训练分类器
classifier.fit(X_train, y_train)
# 在测试集上进行预测
y_pred = classifier.predict(X_test)
# 计算预测精度并输出
accuracy = classifier.score(X_test, y_test)
print("Accuracy:", accuracy)
# 计算混淆矩阵并绘制热力图
cm = confusion_matrix(y_test, y_pred)
sns.heatmap(cm, annot=True, cmap="Blues")
plt.show()
```
在这个代码示例中,我们首先导入了需要使用的库,并读取了包含自变量和因变量的Excel表格。然后,我们将数据集分为训练集和测试集,并定义了一个包含100个决策树的随机森林分类器。我们使用训练集来拟合分类器,并在测试集上进行预测。最后,我们计算了预测精度并输出,以及绘制了混淆矩阵的热力图。
需要注意的一点是,这个代码示例中使用的Excel表格并没有给出,需要根据自己的需求进行相应修改。同时,如果Excel表格中包含多个工作表,需要使用`pd.read_excel('data.xlsx', sheet_name='工作表名称')`来指定读取的工作表名称。
阅读全文