首页随机森林分类python实战

随机森林分类python实战

时间: 2024-06-06 13:04:26 浏览: 97

随机森林是一种常用的机器学习算法，它可以用于分类和回归问题。随机森林将多个决策树集成在一起，每个决策树都是一个弱分类器，通过集成多个弱分类器形成一个强分类器。在训练过程中，随机森林会随机选取一部分特征来训练每个决策树，这样可以减少特征间的相关性，提高模型的泛化能力和鲁棒性。下面是随机森林分类的python实战： 1. 加载数据集首先需要加载数据集，这里以鸢尾花数据集为例： ```python from sklearn.datasets import load_iris iris = load_iris() X = iris.data y = iris.target ``` 2. 划分数据集将数据集划分为训练集和测试集： ```python from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42) ``` 3. 训练模型使用随机森林分类器训练模型： ```python from sklearn.ensemble import RandomForestClassifier rfc = RandomForestClassifier(n_estimators=10, random_state=42) rfc.fit(X_train, y_train) ``` 其中，n_estimators表示决策树的数量。 4. 预测和评估使用训练好的模型对测试集进行预测，并计算模型的准确率： ```python from sklearn.metrics import accuracy_score y_pred = rfc.predict(X_test) accuracy = accuracy_score(y_test, y_pred) print('Accuracy:', accuracy) ``` 5. 相关问题：

阅读全文