使用线性回归,通过代码实现一个具体的任务,并给出数据集。
时间: 2023-12-20 19:04:18 浏览: 116
任务描述:使用线性回归模型预测房价。
数据集:我们使用 Scikit-learn 内置的波士顿房价数据集来进行线性回归。该数据集包含 506 个样本,每个样本包含 13 个特征,包括城镇人均犯罪率、每个城镇非零售商业用地的比例等,以及目标变量(房价中位数)。
代码实现:
```python
from sklearn.datasets import load_boston
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error
# 加载数据集
boston = load_boston()
X = boston.data
y = boston.target
# 划分数据集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 训练模型
model = LinearRegression()
model.fit(X_train, y_train)
# 预测
y_pred = model.predict(X_test)
# 计算均方误差
mse = mean_squared_error(y_test, y_pred)
print("均方误差:", mse)
```
运行结果:
```
均方误差: 24.291119474973616
```
说明:均方误差越小,说明模型预测效果越好。在这个例子中,我们使用波士顿房价数据集训练了一个线性回归模型,并使用均方误差作为评价指标。在测试集上的均方误差为 24.29,说明该模型预测效果还不错。
阅读全文