根据数据集中的属性有价格,位置,开发商,面积。使用回归分析建模并预测房价的代码
时间: 2024-02-28 19:56:25 浏览: 19
好的,以下是一个简单的回归分析建模并预测房价的 Python 代码:
```python
import pandas as pd
import numpy as np
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
# 读取数据集
data = pd.read_csv('housing.csv')
# 提取特征和目标变量
X = data[['price', 'location', 'developer', 'area']]
y = data['house_price']
# 将类别变量转换为虚拟变量
X = pd.get_dummies(X)
# 拆分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)
# 建立线性回归模型
model = LinearRegression()
# 拟合模型
model.fit(X_train, y_train)
# 预测测试集
y_pred = model.predict(X_test)
# 计算模型的性能指标
from sklearn.metrics import mean_squared_error, r2_score
print('均方误差:', mean_squared_error(y_test, y_pred))
print('R2得分:', r2_score(y_test, y_pred))
```
以上代码中,首先我们读取数据集,然后提取特征和目标变量。由于特征中包含类别变量,我们使用 `get_dummies` 函数将其转换为虚拟变量。然后,我们将数据集拆分为训练集和测试集,并建立一个线性回归模型。最后,我们使用测试集来评估模型的性能指标,如均方误差和 R2 得分。