python随机森林回归预测
时间: 2023-09-10 18:14:26 浏览: 82
用机器学习的方法对学生成绩进行统计分析和预测。包括决策树算法、逻辑回归算法、随机森林算法等,用python.zip
5星 · 资源好评率100%
随机森林回归是一种基于决策树的集成学习算法,它通过随机抽样和随机特征选择的方式构建多个决策树,再将这些决策树的预测结果进行平均或投票来得到最终的预测结果。下面是使用Python进行随机森林回归预测的示例代码:
```python
# 导入相关库
import numpy as np
import pandas as pd
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_squared_error
# 读取数据集
data = pd.read_csv('data.csv')
# 划分特征和标签
X = data.iloc[:, :-1].values
y = data.iloc[:, -1].values
# 划分训练集和测试集
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
# 构建随机森林回归模型
regressor = RandomForestRegressor(n_estimators=100, random_state=0)
# 训练模型
regressor.fit(X_train, y_train)
# 预测测试集结果
y_pred = regressor.predict(X_test)
# 计算均方误差
mse = mean_squared_error(y_test, y_pred)
print("均方误差:", mse)
```
在这个示例代码中,我们首先导入了相关的库,然后读取了一个名为data.csv的数据集。接着,我们将数据集中的特征和标签分别存储在X和y中,并使用train_test_split函数将数据集划分为训练集和测试集。然后,我们构建了一个拥有100个决策树的随机森林回归模型,并使用fit方法来训练模型。最后,使用predict方法来预测测试集结果,并使用mean_squared_error函数计算均方误差。
阅读全文