提供一个波士顿房价的数据集
时间: 2024-06-21 20:03:27 浏览: 106
波士顿房价数据集是一个经典的机器学习数据集,它最早来自于1978年H. D. Longley发表在《美国统计学会》(American Statistical Association)上的一篇论文。这个数据集通常被用来进行回归分析和预测建模,特别是线性回归和决策树等算法的学习。它包含了13个特征,如犯罪率、人口密度、平均住宅年龄等,以及一个目标变量——波士顿地区的房屋中位数价格。
数据集中的一些关键变量包括:
1. CRIM:犯罪率(每平方英里的犯罪率)
2.ZN:陆地总面积与建成区面积的比例
3.INDUS:非零售业务占地比例
4.CHAS:查尔斯河缓冲区(1表示在河边,0表示不在)
5.NOX:氮氧化物浓度(ppm)
6.RM:每个住宅的房间数量
7.AGE:住宅的建造年代
8.DIS:到最近城市的距离(单位为税英里)
9.RAD:五个波士顿周边的主要道路辐射区域
10.TAX:每千平方英尺的土地税
11.PTRATIO:学生与教师的比例
12.B:1000(Bk - 0.63)^2,其中Bk是黑人占总人口的比例
13.LSTAT:低收入家庭比例
要获取这个数据集,你可以从以下几个地方找到:
1. scikit-learn库:Python中的机器学习库提供了预加载的波士顿房价数据。
```python
from sklearn.datasets import load_boston
boston = load_boston()
```
2. UCI Machine Learning Repository:https://archive.ics.uci.edu/ml/datasets/Housing
3. 数据科学竞赛平台如Kaggle:有时也有包含波士顿房价数据的实战项目可供学习。
阅读全文