boston 房价数据集的网站
时间: 2024-06-19 16:02:27 浏览: 12
Boston房价数据集是一个经典的回归问题数据集,它包含506个样本,每个样本有13个特征变量,用于预测波士顿郊区房价的中位数。你可以在以下网站上找到该数据集:
1. UCI Machine Learning Repository: http://archive.ics.uci.edu/ml/datasets/Housing
2. Kaggle: https://www.kaggle.com/c/boston-housing
3. Scikit-learn: https://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_boston.html
希望这些信息可以帮到你。如果你还有其他相关的问题,可以继续问我哦。
相关问题
boston 房价数据集的csv 格式
波士顿房价数据集是一个常用的机器学习数据集,它包含了在美国马萨诸塞州波士顿地区不同地段的房屋销售价格以及相关的特征数据。该数据集采用CSV格式进行存储,以便于数据的处理和分析。
CSV是逗号分隔值(Comma-Separated Values)的缩写,它是一种常用的电子表格数据存储格式。在波士顿房价数据集中,每一行代表一个样本(房屋),每一列代表一个特征。首行通常是特征名称,而从第二行开始,每一行依次存储了不同房屋的特征数据。
波士顿房价数据集中包含了14个不同的特征,如犯罪率、住宅用地所占比例、距离近邻商业区的权重等等。除了这些特征以外,数据集的最后一列是该房屋销售价格的中位数,作为目标变量。
CSV格式的数据可以通过各种软件和编程语言进行读取和处理,例如Python中的pandas库、R语言中的read.csv()函数等。研究人员和学者可以使用这些工具来导入和分析波士顿房价数据集,探索其中的模式和关联性,以及预测房屋的销售价格。
总而言之,波士顿房价数据集以CSV格式存储,方便使用各种工具进行数据分析和建模。了解该数据集的结构和特征对于进行房价预测或其他相关研究至关重要。
1、导入Boston房价数据集并进行数据预处理
首先,我们需要导入Boston房价数据集。可以使用scikit-learn自带的方法来加载数据集。
```python
from sklearn.datasets import load_boston
boston = load_boston()
```
加载完数据集后,我们可以使用pandas库将数据转换为DataFrame格式,方便进行数据预处理。
```python
import pandas as pd
data = pd.DataFrame(boston.data, columns=boston.feature_names)
target = pd.DataFrame(boston.target, columns=["MEDV"])
```
接着,我们可以查看数据集的基本信息,包括数据的形状、列名、数据类型等。
```python
print(data.shape)
print(data.columns)
print(data.dtypes)
```
输出结果为:
```
(506, 13)
Index(['CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE', 'DIS', 'RAD', 'TAX', 'PTRATIO', 'B', 'LSTAT'], dtype='object')
CRIM float64
ZN float64
INDUS float64
CHAS float64
NOX float64
RM float64
AGE float64
DIS float64
RAD float64
TAX float64
PTRATIO float64
B float64
LSTAT float64
dtype: object
```
我们可以看到,数据集共有506条数据,包含13个特征,每个特征的数据类型都是float64类型。
接下来,我们可以检查数据集是否存在缺失值。
```python
print(data.isnull().sum())
```
输出结果为:
```
CRIM 0
ZN 0
INDUS 0
CHAS 0
NOX 0
RM 0
AGE 0
DIS 0
RAD 0
TAX 0
PTRATIO 0
B 0
LSTAT 0
dtype: int64
```
我们可以看到,数据集中不存在缺失值。
最后,我们可以将特征和标签合并起来,得到完整的数据集。
```python
data = pd.concat([data, target], axis=1)
```
至此,数据预处理完毕。
相关推荐
![csv](https://img-home.csdnimg.cn/images/20210720083646.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)