python随机森林回归实现
时间: 2024-10-15 07:13:48 浏览: 36
Python中的随机森林(Random Forest)是一种集成学习方法,特别适用于回归任务。它是通过构建大量的决策树并取其平均结果来提高预测性能。对于回归随机森林,主要步骤如下:
1. 导入所需库:首先,你需要导入`sklearn.ensemble`模块下的`RandomForestRegressor`,这是随机森林回归模型。
```python
from sklearn.ensemble import RandomForestRegressor
```
2. 准备数据:准备训练集和测试集,通常包括特征数据和对应的标签值。
```python
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```
3. 初始化模型:设置随机森林的参数,如树的数量(n_estimators)、最大深度(max_depth)等。
```python
rf_model = RandomForestRegressor(n_estimators=100, max_depth=None, random_state=42)
```
4. 训练模型:使用训练数据拟合模型。
```python
rf_model.fit(X_train, y_train)
```
5. 预测:对测试数据进行预测。
```python
y_pred = rf_model.predict(X_test)
```
6. 评估:使用评估指标(如均方误差MSE、R²分数)检查模型的性能。
```python
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)
```
阅读全文