如何利用自带波士顿房价数据集,训练线性回归模型,并打印测试集中的第一个房屋数据的预测价格
时间: 2024-12-13 15:27:28 浏览: 16
使用scikit-learn内置的波士顿房价数据集来训练模型
首先,让我们通过Python的scikit-learn库来演示如何使用波士顿房价数据集(Boston Housing Dataset)训练一个线性回归模型并预测测试集的第一个样本的价格。这是一个经典的机器学习教程任务。
1. **加载所需库**:
```python
import numpy as np
from sklearn.datasets import load_boston
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error
```
2. **加载数据集**:
```python
boston = load_boston()
X = boston.data
y = boston.target
```
3. **划分训练集和测试集**:
```python
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```
4. **创建并训练线性回归模型**:
```python
model = LinearRegression()
model.fit(X_train, y_train)
```
5. **预测测试集的第一个样本的价格**:
```python
first_sample = X_test[0]
predicted_price = model.predict(np.array([first_sample]))
```
6. **打印预测结果**:
```python
print(f"测试集中第一个房屋的实际价格: {y_test[0]}")
print(f"预测的第1个房屋价格: {predicted_price[0]}")
```
7. **评估模型性能**(如果需要):
```python
mse = mean_squared_error(y_test, model.predict(X_test))
print("Mean Squared Error:", mse)
```
完成以上步骤后,你就成功地训练了一个线性回归模型并预测了测试集中第一个房屋的预期价格。
阅读全文