python用线性回归来算房屋面积和房屋价格
时间: 2024-09-11 07:15:03 浏览: 45
Python 中可以使用线性回归模型来进行房价预测,通常将房屋面积作为输入特征,而房屋价格作为输出目标。线性回归是一种简单的统计学习方法,假设因变量(价格)与自变量(面积)之间存在线性关系。以下是使用 Python 的 `sklearn` 库实现这一任务的基本步骤:
1. 导入所需库:
```python
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score
```
2. 加载数据集(假设是一个CSV文件):
```python
data = pd.read_csv('house_data.csv')
```
3. 数据预处理:
- 检查缺失值并填充(如果需要)
- 将'房屋面积'列拆分为数值型特征
4. 划分训练集和测试集:
```python
X = data['房屋面积'].values.reshape(-1, 1) # 特征
y = data['房屋价格'] # 目标值
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```
5. 创建并训练线性回归模型:
```python
model = LinearRegression()
model.fit(X_train, y_train)
```
6. 预测及评估:
```python
y_pred = model.predict(X_test)
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)
print(f"均方误差(MSE): {mse}")
print(f"R^2分数: {r2}")
```
阅读全文