导入预制的波士顿房价数据集,设置房价为y,特征为x。设置百分之三十的数据为测试集,导入线性回归模型,用线性回归模型拟合波士顿房价数据集,用训练完的模型进行预测,输出线性回归模型的斜率和截距
时间: 2024-11-06 12:13:13 浏览: 6
机器学习笔记2–sklearn之iris数据集
为了完成这个任务,你需要按照以下步骤操作:
1. 首先,导入必要的库:
```python
import numpy as np
from sklearn.datasets import load_boston
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error
```
2. 加载波士顿房价数据集,并分离特征(X)和目标变量(y):
```python
boston = load_boston()
X = boston.data
y = boston.target
```
3. 划分训练集和测试集,通常使用70%的数据作为训练集,剩余30%作为测试集:
```python
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
```
4. 创建并训练线性回归模型:
```python
model = LinearRegression()
model.fit(X_train, y_train)
```
5. 使用训练好的模型进行预测,并获取斜率(coef_)和截距(intercept_):
```python
predictions = model.predict(X_test)
slope = model.coef_[0] # 斜率
intercept = model.intercept_ # 截距
print("模型的斜率:", slope)
print("模型的截距:", intercept)
```
6. 可以计算一下模型的性能指标,比如均方误差(MSE):
```python
mse = mean_squared_error(y_test, predictions)
print("均方误差(MSE):", mse)
```
以上就是完整的操作过程。注意这里的`random_state`参数是为了保证每次划分数据集的结果一致,如果不需要一致,可以去掉。
阅读全文