用python语言用随机森林算法写一个读取excel数据,输入有3个特征,输出一个特征,将excel里的数据的百分之90作为训练集,百分之10作为测试集,并且画出图像的代码
时间: 2023-06-15 15:06:13 浏览: 100
随机森林,随机森林算法,Python
5星 · 资源好评率100%
以下是使用Python和随机森林算法读取Excel数据、训练和测试模型、绘制图像的代码:
```python
import pandas as pd
from sklearn.ensemble import RandomForestRegressor
import matplotlib.pyplot as plt
# 读取Excel数据
data = pd.read_excel('data.xlsx')
# 前3列为特征,最后1列为输出
x = data.iloc[:, 0:3].values
y = data.iloc[:, 3].values
# 划分训练集和测试集
train_size = int(len(data) * 0.9)
x_train, x_test = x[:train_size], x[train_size:]
y_train, y_test = y[:train_size], y[train_size:]
# 创建随机森林模型
model = RandomForestRegressor(n_estimators=100, random_state=0)
# 训练模型
model.fit(x_train, y_train)
# 测试模型
y_pred = model.predict(x_test)
# 绘制图像
plt.plot(y_test, color='red', label='Real data')
plt.plot(y_pred, color='blue', label='Predicted data')
plt.title('Random Forest Regression')
plt.xlabel('Sample')
plt.ylabel('Output')
plt.legend()
plt.show()
```
需要注意的是,这里的Excel文件名为"data.xlsx",并且假设数据的前三列为特征,最后一列为输出。同时,随机森林模型中选取了100个决策树作为基础模型,可以根据实际情况进行调整。
阅读全文