波士顿房价预测:变量筛选与多元模型比较

需积分: 0 1 下载量 154 浏览量 更新于2024-06-30 收藏 870KB DOCX 举报
在本研究中,第四组C题(终版)1聚焦于波士顿房价预测与分析。核心任务是探讨如何通过统计学方法和机器学习技术来理解影响房价的关键因素。首先,针对问题一,通过对14个可能影响房价的变量(其中X14代表户主住房价值的中位数,作为因变量)进行皮尔逊相关性分析,研究人员构建了一个变量间关系的矩阵图,评估了各个变量对房价的直接影响。通过比较不同数量的相关性强变量(如6个、8个或全部13个)对房价预测的拟合效果,他们发现利用所有13个变量的回归模型在预测准确性上表现最佳。 问题二则引入了人工神经网络模型,特别是BP神经网络。通过将数据集划分为训练集和测试集,神经网络的参数被优化以达到高拟合度。训练样本中的R²值(相关性)接近1,表明模型能很好地捕捉到数据中的模式,而测试样本的均方误差(MSE)虽然在预测样本部分稍高,但仍显示了良好的预测性能。 对于问题三,目标是根据房子的宜居性进行分类。研究采用了秩和比(RSR)方法对数据进行预处理,将房子分为七个等级,从非常宜居到非常不宜居,以反映居住环境的优劣。 问题四涉及购房建议,通过多维度分析,研究发现购房者更倾向于选择犯罪率低、远离污染源、商业占地少和空气质量好的房子。这些因素对购房者决策具有显著影响。 整个研究强调了多重共线性、BP神经网络模型、交通仿真(如Vissim)、模糊数学和Ridit分析等工具在解决这些问题时的作用。通过对这些方法的综合运用,研究人员能够更深入地理解影响波士顿房价的因素,并为购房者提供实用的建议。