帮我写一段代码,用多个连续变化的属性来预测目标值(连续变量)。用随机森林的模型
时间: 2024-09-25 22:03:16 浏览: 31
当然可以,这里是一个使用Python的Scikit-Learn库来创建一个随机森林回归模型的例子,假设我们有一个包含连续属性和目标值的数据集。在这个例子中,我们将使用`numpy`生成一些模拟数据:
```python
import numpy as np
from sklearn.ensemble import RandomForestRegressor
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error
# 生成模拟数据
np.random.seed(42)
n_samples, n_features = 500, 5
X = np.random.rand(n_samples, n_features) # 多个连续属性
y = X[:, 0] + 2 * X[:, 1] - 0.5 * X[:, 2] + 0.1 * np.random.normal(size=n_samples) # 目标值基于连续属性计算
# 划分数据集为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 创建并训练随机森林回归模型
model = RandomForestRegressor(n_estimators=100, random_state=42)
model.fit(X_train, y_train)
# 预测测试集
y_pred = model.predict(X_test)
# 计算MSE作为评估指标
mse = mean_squared_error(y_test, y_pred)
print(f"Mean Squared Error: {mse}")
# 可视化结果 (假设可视化库如matplotlib已安装)
if 'matplotlib.pyplot' in dir():
import matplotlib.pyplot as plt
plt.scatter(y_test, y_pred, alpha=0.5)
plt.xlabel('True Values')
plt.ylabel('Predicted Values')
plt.show()
```
在这个代码中,我们首先生成了一个二维的数据集,其中第一个属性直接决定了目标值,后续的属性通过线性组合的方式对目标值有一定的影响。然后,我们拆分数据为训练集和测试集,训练了一个随机森林回归模型,并在测试集上进行了预测,最后计算了预测结果的均方误差。
阅读全文