波士顿房价数据集有哪些特征
时间: 2024-08-12 20:10:53 浏览: 42
波士顿房价数据集,也称为 Boston Housing Dataset,是统计学和机器学习领域中常用的一个经典数据集。它最初由哈佛大学统计系的Thomas J. D. Cook于1978年发布,主要用于研究房价预测和回归分析。该数据集包含13个特征(或变量)描述了波士顿地区的房价:
1. **CRIM** (per capita crime rate by town):城镇的人均犯罪率。
2. **ZN** (proportion of residential land zoned for lots over 25,000 sq.ft.):住宅区的土地比例,用于预测房屋是否位于高密度区域。
3. **INDUS** (proportion of non-retail business acres per town):非零售商业用地比例。
4. **CHAS** (Charles River dummy variable (=1 if tract bounds river; 0 otherwise)):河流变量,表示房屋是否靠近查尔斯河。
5. **NOX** (nitric oxides concentration (parts per ten million)):一氧化氮浓度。
6. **RM** (average number of rooms per dwelling):每户平均房间数。
7. **AGE** (proportion of owner-occupied units built prior to 1940):房屋的建造年代。
8. **DIS** (weighted distances to five Boston employment centres):到五个就业中心的距离。
9. **RAD** (index of accessibility to radial highways):周边高速公路的可达性指数。
10. **TAX** (full-value property-tax rate per $10,000):税率。
11. **PTRATIO** (pupil-teacher ratio by town):学生与教师的比例。
12. **B** (1000(Bk - 0.63)^2 where Bk is the proportion of blacks by town):城市种族多样性指数。
13. **LSTAT** (percentage lower status of the population):低收入家庭比例。
阅读全文