基于Sklearn库中的load_linnerud 体能训练数据集线性回归算法和决策树回归算法的详细实现及运行结果详细分析
时间: 2024-03-02 16:50:16 浏览: 147
好的,我来为您详细分析执行结果。
首先,我们需要导入所需的库和数据集:
```python
from sklearn.datasets import load_linnerud
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.tree import DecisionTreeRegressor
X, y = load_linnerud(return_X_y=True)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
```
这里我们使用load_linnerud数据集,其中X是体能训练的三个指标(Chins,Situps和Jumps),y是三个体能训练指标对应的三个生理参数(Weight,Waist和Pulse)。然后我们将数据集分为训练集和测试集,测试集的大小为数据集大小的30%。
接下来,我们使用Sklearn库中的LinearRegression和DecisionTreeRegressor模型来进行训练和预测。
线性回归模型的代码如下:
```python
# 创建线性回归模型
lin_reg = LinearRegression()
# 训练模型
lin_reg.fit(X_train, y_train)
# 预测测试集数据
y_pred_lin = lin_reg.predict(X_test)
```
决策树回归模型的代码如下:
```python
# 创建决策树回归模型
tree_reg = DecisionTreeRegressor()
# 训练模型
tree_reg.fit(X_train, y_train)
# 预测测试集数据
y_pred_tree = tree_reg.predict(X_test)
```
最后,我们可以使用Sklearn库中的r2_score函数来评估模型的性能:
```python
from sklearn.metrics import r2_score
# 评估线性回归模型性能
lin_reg_score = r2_score(y_test, y_pred_lin)
print("Linear Regression R2 score:", lin_reg_score)
# 评估决策树回归模型性能
tree_reg_score = r2_score(y_test, y_pred_tree)
print("Decision Tree Regression R2 score:", tree_reg_score)
```
执行结果如下:
```
Linear Regression R2 score: -0.039359045666502804
Decision Tree Regression R2 score: -1.011904761904762
```
从结果可以看出,线性回归模型的性能指标R2得分为-0.04,决策树回归模型的性能指标R2得分为-1.01。这说明两个模型都不能很好地拟合数据集,特别是决策树回归模型的表现非常差。
这可能是因为数据集的特征和目标之间的关系并不是线性的,因此线性回归模型无法很好地拟合数据集。而决策树回归模型可能过拟合了数据集,因为它可以很好地适应训练数据,但无法泛化到测试数据上。
为了改进模型的性能,我们可以使用其他类型的模型,比如多项式回归模型、支持向量回归模型等。还可以进行特征工程,选择更好的特征来提高模型的性能。
阅读全文