随机森林分类预测python并输出精度矩阵
时间: 2023-06-30 10:03:35 浏览: 233
使用随机森林进行分类预测,可以使用scikit-learn库中的RandomForestClassifier类。下面是一个示例代码:
```python
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, confusion_matrix
from sklearn.model_selection import train_test_split
import pandas as pd
# 读取数据
data = pd.read_csv('data.csv')
# 划分数据集和测试集
X_train, X_test, y_train, y_test = train_test_split(data.drop('label', axis=1), data['label'], test_size=0.2, random_state=42)
# 初始化随机森林分类器
rfc = RandomForestClassifier(n_estimators=100, random_state=42)
# 拟合数据
rfc.fit(X_train, y_train)
# 预测测试集
y_pred = rfc.predict(X_test)
# 输出精度矩阵
print('Accuracy:', accuracy_score(y_test, y_pred))
print('Confusion Matrix:\n', confusion_matrix(y_test, y_pred))
```
在这个示例代码中,我们首先使用pandas库读取了一个名为`data.csv`的数据集。然后使用train_test_split函数将数据集划分成训练集和测试集。接着,我们初始化了一个包含100个决策树的随机森林分类器,并拟合训练集数据。最后,我们使用预测测试集数据,并输出了精度矩阵。
注意,`accuracy_score`函数用于计算分类器的精度,而`confusion_matrix`函数则用于计算混淆矩阵,从而得到分类器的性能指标。
阅读全文