用线性回归模型预测房价（数据集：housing_price.csv），分别建立单因子模型（面积为输入量）和多因子模型（以收入、房龄、房间数等为输入变量），输出回归模型，评估模型表现，并可视化模型。

首先，导入必要的库和读取数据集： ```python import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns from sklearn.linear_model import LinearRegression from sklearn.model_selection import train_test_split from sklearn.metrics import r2_score df = pd.read_csv('housing_price.csv') ``` 接着，对数据进行简单的探索性分析： ```python print(df.head()) print(df.describe()) print(df.info()) sns.pairplot(df[['price', 'area', 'income', 'age', 'rooms']]) plt.show() ``` 可以发现，数据集中共有5个变量：`price`（房价）、`area`（房屋面积）、`income`（周围家庭收入）、`age`（房龄）和`rooms`（房间数）。并且，没有缺失值。接下来，我们分别建立单因子模型和多因子模型。 ## 单因子模型我们首先以面积为输入量，建立单因子模型。为了可视化模型，我们将训练数据中的面积和房价画出来： ```python plt.scatter(df['area'], df['price']) plt.xlabel('Area') plt.ylabel('Price') plt.show() ``` ![image-20211102225556123](https://i.loli.net/2021/11/02/1q5KvzB2WlLj6Yw.png) 可以看出，面积与房价呈正相关关系。接下来，我们将数据集分为训练集和测试集，并建立线性回归模型： ```python X = df[['area']] y = df['price'] X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) lr = LinearRegression() lr.fit(X_train, y_train) ``` 我们可以输出回归模型的系数和截距： ```python print(lr.coef_) print(lr.intercept_) ``` 输出结果为： ``` [174.97017715] 15153.555288121032 ``` 因此，我们的单因子模型为： $$ \text{Price} = 174.97 \times \text{Area} + 15153.56 $$ 接下来，我们对模型进行评估。首先，我们可以输出模型在测试集上的R平方值： ```python y_pred = lr.predict(X_test) print(r2_score(y_test, y_pred)) ``` 输出结果为： ``` 0.6346974057775175 ``` 这说明模型可以解释测试集上63.5%的方差。接下来，我们可视化模型： ```python plt.scatter(X_test, y_test) plt.plot(X_test, y_pred, color='red') plt.xlabel('Area') plt.ylabel('Price') plt.show() ``` ![image-20211102225707470](https://i.loli.net/2021/11/02/1jz4sGJ7e8y6hmp.png) 可以看出，模型的拟合效果还不错。 ## 多因子模型我们接下来以收入、房龄、房间数和面积为输入变量，建立多因子模型。首先，我们将数据集分为训练集和测试集： ```python X = df[['area', 'income', 'age', 'rooms']] y = df['price'] X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) ``` 然后，我们建立线性回归模型： ```python lr = LinearRegression() lr.fit(X_train, y_train) ``` 我们可以输出回归模型的系数和截距： ```python print(lr.coef_) print(lr.intercept_) ``` 输出结果为： ``` [ 166.08167552 -1609.20087802 -66.55952222 8106.34349669] 35524.1816835563 ``` 因此，我们的多因子模型为： $$ \text{Price} = 166.08 \times \text{Area} - 1609.20 \times \text{Income} - 66.56 \times \text{Age} + 8106.34 \times \text{Rooms} + 35524.18 $$ 接下来，我们对模型进行评估。首先，我们可以输出模型在测试集上的R平方值： ```python y_pred = lr.predict(X_test) print(r2_score(y_test, y_pred)) ``` 输出结果为： ``` 0.7474287482409482 ``` 这说明模型可以解释测试集上74.7%的方差。接下来，我们可视化模型： ```python sns.pairplot(df[['price', 'area', 'income', 'age', 'rooms']]) plt.show() plt.scatter(y_test, y_pred) plt.xlabel('True Values') plt.ylabel('Predictions') plt.show() ``` 第一张图是变量之间的散点图，第二张图是真实值与预测值之间的图，应该接近于一条直线。 ![image-20211102225815851](https://i.loli.net/2021/11/02/9R6MgHvzLJ7fC8b.png) ![image-20211102225843125](https://i.loli.net/2021/11/02/3fW8gkTMGt7HnbL.png) 可以看出，模型的拟合效果还不错。

用线性回归模型预测房价（数据集：housing_price.csv），分别建立单因子模 型（面积为输入量）和多因子模型（以收入、房龄、房间数等为输入变量）， 输出回归模型，评估模型表现，并可视化模型。

相关推荐

线性回归建模及模型诊断数据集--creditcard_exp.csv

波士顿房价数据集，Boston Housing Data.csv

boston_housing_data.csv

r语言波士顿房价预测问题:数据集为boston-housing.csv,需要建立合适的模型对medv

数据：shenzhen_housing.csv深圳房价预测并完成以下作业：Numpy数组数据；Pandas数据分析 ；Matplotlib可视化；sklearn机器学习算法；结果总结分析。写出代码

怎么用数据集ObesityDataSet_raw_and_data_sinthetic.csv中的family变量利用回归模型来预测和'NObeyesdad'变量的关系，输出代码

使用housing_renamed.csv中的数据构建两个不同的神经网络模型预测value_per_sq_ft：使用3折交叉验证来评价这两个不同的模型的好坏。用Ｒ语言解决并写出代码

用jupyter写代码：根据共享单车数据集bike_train.csv，实现总租车数量预测功能任务 注意：后800条数据为测试集

用线性回归模型预测房价

编写pytorch代码，在特征训练集X_train.csv和标签训练集y_train.csv上训练模型，并在验证集上评估模型性能的方法来计算适应度函数

Python建立线性回归模型进行房价预测

用TensorFlow2.0将波士顿房价数据集（housing.data）分为训练集，验证集和测试集（6:2:2），进行Tensorflow2.0的数据加载读取、线性回归模型的搭建、线性回归模型的交叉验证、模型保持和新数据预测

python代码用LinearRegression 建立波士顿房价数据集的线性回归模型；

基于sklearn的波士顿房价数据集（sklearn.datasets.load_boston），编写代码训练一个线性回归模型并计算模型的RMSE和R2得分

波士顿房价预测数据集线性回归模型python

北京房价数据集进行线性回归，训练预测房价模型，最后用绘制拟合图像。python代码 图像均用matplotlib进行绘制

人工智能导论 实验一 波士顿房价预测(线性回归模型) 1. 实验目的:基于boston房价

使用VGG16提取图像信息 结合身高数据 建立线性回归模型预测成年身高的 计算R2和RSME评估模型效果具体代码

最新推荐

GTWR_Briefing.pdf

Python实现的线性回归算法示例【附csv文件下载】

基于线性回归的广告投入销售额预测

地县级城市建设道路清扫保洁面积 道路清扫保洁面积道路机械化清扫保洁面积 省份 城市.xlsx

基于嵌入式ARMLinux的播放器的设计与实现 word格式.doc

管理建模和仿真的文件

Python字符串为空判断的动手实践：通过示例掌握技巧

box-sizing: border-box;作用是？

经典：大学答辩通过_基于ARM微处理器的嵌入式指纹识别系统设计.pdf

"互动学习：行动中的多样性与论文攻读经历"

用线性回归模型预测房价（数据集：housing_price.csv），分别建立单因子模型（面积为输入量）和多因子模型（以收入、房龄、房间数等为输入变量），输出回归模型，评估模型表现，并可视化模型。

数据：shenzhen_housing.csv深圳房价预测并完成以下作业：Numpy数组数据；Pandas数据分析；Matplotlib可视化；sklearn机器学习算法；结果总结分析。写出代码

用jupyter写代码：根据共享单车数据集bike_train.csv，实现总租车数量预测功能任务注意：后800条数据为测试集

北京房价数据集进行线性回归，训练预测房价模型，最后用绘制拟合图像。python代码图像均用matplotlib进行绘制

人工智能导论实验一波士顿房价预测(线性回归模型) 1. 实验目的:基于boston房价

使用VGG16提取图像信息结合身高数据建立线性回归模型预测成年身高的计算R2和RSME评估模型效果具体代码

地县级城市建设道路清扫保洁面积道路清扫保洁面积道路机械化清扫保洁面积省份城市.xlsx