随机森林实现多分类python代码
时间: 2024-03-02 15:45:20 浏览: 107
以下是使用scikit-learn框架实现随机森林进行多分类的Python代码:
```python
# 导入基础库
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score
import pandas as pd
# 数据读取及处理
data = pd.read_csv('data.csv')
X = data.iloc[:, :-1].values
y = data.iloc[:, -1].values
# 训练集和测试集划分
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
# 特征标准化
sc = StandardScaler()
X_train = sc.fit_transform(X_train)
X_test = sc.transform(X_test)
# 随机森林训练
classifier = RandomForestClassifier(n_estimators=10, criterion='entropy', random_state=0)
classifier.fit(X_train, y_train)
# 预测
y_pred = classifier.predict(X_test)
# 输出结果
print("Accuracy:", accuracy_score(y_test, y_pred))
```
其中,`data.csv`是包含训练数据的CSV文件,`X`是特征矩阵,`y`是标签向量。在训练之前,需要将数据集划分为训练集和测试集,并对特征进行标准化处理。在训练过程中,需要设置随机森林的参数,例如树的数量、划分标准等。最后,使用训练好的模型对测试集进行预测,并计算准确率。
阅读全文