使用线性回归与波士顿房价数据集预测房价
时间: 2023-11-10 21:07:25 浏览: 113
线性回归是一种常见的机器学习算法,可以用于预测数值型数据。波士顿房价数据集是一个经典的用于回归问题的数据集,其中包含了波士顿地区的房屋信息以及对应的房价。下面是使用Python进行线性回归与波士顿房价数据集预测房价的步骤:
1. 导入必要的库和数据集
```python
import numpy as np
import pandas as pd
from sklearn.datasets import load_boston
boston = load_boston()
```
2. 将数据集转换为DataFrame格式,并查看数据集的基本信息
```python
df = pd.DataFrame(boston.data, columns=boston.feature_names)
df['PRICE'] = boston.target
print(df.head())
print(df.info())
```
3. 划分训练集和测试集
```python
from sklearn.model_selection import train_test_split
X = df.drop('PRICE', axis=1)
y = df['PRICE']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```
4. 使用线性回归模型进行训练和预测
```python
from sklearn.linear_model import LinearRegression
lr = LinearRegression()
lr.fit(X_train, y_train)
y_pred = lr.predict(X_test)
```
5. 评估模型性能
```python
from sklearn.metrics import mean_squared_error, r2_score
print('Mean squared error: %.2f' % mean_squared_error(y_test, y_pred))
print('Coefficient of determination: %.2f' % r2_score(y_test, y_pred))
```
以上就是使用Python进行线性回归与波士顿房价数据集预测房价的步骤。
阅读全文