波士顿房价数据集,探究自变量与因变量的相关性
时间: 2024-08-13 18:05:21 浏览: 95
波士顿房价数据集(Boston Housing Dataset)是统计学和机器学习领域中常用的一个经典数据集,它来源于1978年的哈佛大学住房研究项目。这个数据集由13个特征(自变量)组成,包括犯罪率、住宅区的徒步到市中心的距离、低收入家庭比例、平均房间数、学区质量等,用于预测目标变量——房屋的中位数价格(因变量)。
数据集中的每个观测值代表一个波士顿地区的房价,通过这些特征可以分析各个因素对房价的影响,比如好的学区通常会推高房价,而较高的犯罪率可能会降低房价。这个数据集经常被用于线性回归、决策树、随机森林等模型的训练和评估,以及探索特征之间的相关性和它们对预测结果的贡献。
阅读全文