线性回归实现波士顿房价数据集
时间: 2024-06-16 11:02:53 浏览: 220
线性回归是一种常用的机器学习算法,用于建立一个线性模型来预测连续型的目标变量。波士顿房价数据集是一个经典的用于回归问题的数据集,其中包含了波士顿地区的房屋相关信息和对应的房价。
要实现波士顿房价数据集的线性回归,可以按照以下步骤进行:
1. 导入所需的库和数据集:首先,需要导入相关的Python库,如NumPy、Pandas和Scikit-learn。然后,加载波士顿房价数据集。
2. 数据预处理:对于线性回归,通常需要对数据进行一些预处理操作,如特征缩放和数据分割。可以使用Scikit-learn中的preprocessing模块来进行这些操作。
3. 拟合线性回归模型:使用Scikit-learn中的LinearRegression类来拟合线性回归模型。可以将特征矩阵和目标变量作为输入,然后调用fit()方法进行模型训练。
4. 模型评估:使用评估指标来评估模型的性能,如均方误差(Mean Squared Error)和决定系数(R-squared)。可以使用Scikit-learn中的metrics模块来计算这些指标。
下面是一个示例代码,展示了如何实现线性回归来预测波士顿房价数据集:
```python
import numpy as np
import pandas as pd
from sklearn.datasets import load_boston
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score
# 导入数据集
boston = load_boston()
X = boston.data
y = boston.target
# 数据预处理
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 拟合线性回归模型
model = LinearRegression()
model.fit(X_train, y_train)
# 预测
y_pred = model.predict(X_test)
# 模型评估
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)
print("均方误差(MSE):", mse)
print("决定系数(R-squared):", r2)
```
阅读全文