用Anaconda3 编写python代码,实现决策树回归分析及预测
时间: 2024-01-21 09:16:47 浏览: 91
python使用sklearn实现决策树的方法示例
以下是使用Anaconda3编写Python代码,实现决策树回归分析及预测的示例代码:
```python
# 导入相关库
import numpy as np
import pandas as pd
from sklearn.tree import DecisionTreeRegressor
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error, r2_score
# 读取数据
data = pd.read_csv('data.csv')
# 拆分自变量和因变量
X = data.iloc[:, :-1].values
y = data.iloc[:, -1].values
# 拆分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
# 建立决策树回归模型
dt_reg = DecisionTreeRegressor(random_state=0)
# 模型训练
dt_reg.fit(X_train, y_train)
# 预测测试集
y_pred = dt_reg.predict(X_test)
# 输出模型评估结果
print('均方误差:', mean_squared_error(y_test, y_pred))
print('R^2得分:', r2_score(y_test, y_pred))
```
说明:
1. 首先导入必要的库,包括numpy、pandas、DecisionTreeRegressor、train_test_split和metrics等。
2. 然后读取数据,将自变量和因变量拆分出来。
3. 接着将数据拆分为训练集和测试集,这里将测试集的比例设为0.2,随机种子设为0。
4. 建立决策树回归模型,并利用训练集进行模型训练。
5. 利用模型对测试集进行预测,并输出模型评估结果,包括均方误差和R^2得分。
需要注意的是,上述代码中的数据文件名为data.csv,需要根据实际情况进行修改。同时,还需要根据具体的数据特征进行调整,比如调整自变量和因变量的位置、调整模型参数等。
阅读全文