rf回归预测python代码
时间: 2023-09-06 08:00:52 浏览: 111
RF(Random Forest)回归是一种基于决策树集成的机器学习算法,用于回归问题。以下是使用Python进行RF回归预测的示例代码:
```python
# 导入必要的库
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_squared_error
# 读取数据集
data = pd.read_csv('data.csv')
# 划分特征和目标变量
X = data.drop('target', axis=1)
y = data['target']
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 创建RF回归模型
model = RandomForestRegressor(n_estimators=100, random_state=42)
# 训练模型
model.fit(X_train, y_train)
# 在训练集上进行预测
train_predictions = model.predict(X_train)
# 在测试集上进行预测
test_predictions = model.predict(X_test)
# 评估模型性能
train_rmse = mean_squared_error(y_train, train_predictions, squared=False)
test_rmse = mean_squared_error(y_test, test_predictions, squared=False)
# 打印训练集和测试集的均方根误差
print("训练集均方根误差:", train_rmse)
print("测试集均方根误差:", test_rmse)
```
以上代码首先导入了必要的库,然后读取一个名为`data.csv`的数据集。接下来,将数据集划分为特征变量`X`和目标变量`y`。然后,利用`train_test_split`函数将数据集划分为训练集和测试集。然后,创建一个具有100个决策树的RF回归模型,并使用`fit`函数对训练集进行训练。之后,分别利用训练好的模型对训练集和测试集进行预测,并使用均方根误差(RMSE)作为评估指标。最后,打印训练集和测试集的RMSE。
阅读全文