根据sklearn中的波士顿房价数据,画出不同变量在不同值之间的分布直方图
时间: 2024-11-27 18:24:05 浏览: 7
boston_housing_data.zip_波士顿房价数据集
5星 · 资源好评率100%
在sklearn库中,有一个经典的数据集叫做波士顿房价数据集(Boston Housing Dataset),它包含了14种特征描述了波士顿地区的房屋情况,以及对应的房价。要画出不同变量(即特征)在不同值范围内的分布直方图,可以按照以下步骤操作:
1. 首先,需要导入必要的库,如`numpy`, `pandas`, 和 `matplotlib`,以及 `sklearn.datasets` 来加载数据。
```python
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.datasets import load_boston
```
2. 加载波士顿房价数据集并转换为DataFrame方便处理。
```python
boston = load_boston()
df_boston = pd.DataFrame(boston.data, columns=boston.feature_names)
```
3. 对每个特征(列),绘制直方图。这里我们选取其中一个例子,例如`RM`(房间数):
```python
feature_to_plot = 'RM'
plt.figure(figsize=(8, 6))
plt.hist(df_boston[feature_to_plot], bins=20, edgecolor='black')
plt.xlabel('Rooms per dwelling')
plt.ylabel('Frequency')
plt.title(f'Distribution of {feature_to_plot} in Boston Housing Data')
plt.show()
```
你可以遍历所有特征名,为每个特征都绘制一张直方图。如果你想比较它们之间的差异,可以在同一个图形中堆叠或并排放置直方图。
阅读全文