如何用直方图或密度图展示住房年龄中位数、总房间数、总卧室数、人口、家庭数、收入中位数和房价中位数分布情况
时间: 2023-07-04 09:08:40 浏览: 67
可以使用Python中的Matplotlib库绘制直方图或密度图来展示这些特征的分布情况。
以下是一个基本的代码示例,用于展示住房年龄中位数的直方图:
```python
import matplotlib.pyplot as plt
import pandas as pd
# 读取数据
data = pd.read_csv('housing.csv')
# 绘制直方图
plt.hist(data['housing_median_age'], bins=30)
plt.xlabel('Housing Median Age')
plt.ylabel('Frequency')
plt.title('Distribution of Housing Median Age')
plt.show()
```
同样地,可以使用类似的代码来绘制其他特征的直方图或密度图:
```python
# 总房间数
plt.hist(data['total_rooms'], bins=30)
plt.xlabel('Total Rooms')
plt.ylabel('Frequency')
plt.title('Distribution of Total Rooms')
plt.show()
# 总卧室数
plt.hist(data['total_bedrooms'], bins=30)
plt.xlabel('Total Bedrooms')
plt.ylabel('Frequency')
plt.title('Distribution of Total Bedrooms')
plt.show()
# 人口
plt.hist(data['population'], bins=30)
plt.xlabel('Population')
plt.ylabel('Frequency')
plt.title('Distribution of Population')
plt.show()
# 家庭数
plt.hist(data['households'], bins=30)
plt.xlabel('Households')
plt.ylabel('Frequency')
plt.title('Distribution of Households')
plt.show()
# 收入中位数
plt.hist(data['median_income'], bins=30)
plt.xlabel('Median Income')
plt.ylabel('Frequency')
plt.title('Distribution of Median Income')
plt.show()
# 房价中位数
plt.hist(data['median_house_value'], bins=30)
plt.xlabel('Median House Value')
plt.ylabel('Frequency')
plt.title('Distribution of Median House Value')
plt.show()
```
如果想要绘制密度图,可以使用KDE函数:
```python
# 住房年龄中位数
plt.figure(figsize=(8,6))
data['housing_median_age'].plot(kind='kde')
plt.xlabel('Housing Median Age')
plt.ylabel('Density')
plt.title('Distribution of Housing Median Age')
plt.show()
# 总房间数
plt.figure(figsize=(8,6))
data['total_rooms'].plot(kind='kde')
plt.xlabel('Total Rooms')
plt.ylabel('Density')
plt.title('Distribution of Total Rooms')
plt.show()
# 总卧室数
plt.figure(figsize=(8,6))
data['total_bedrooms'].plot(kind='kde')
plt.xlabel('Total Bedrooms')
plt.ylabel('Density')
plt.title('Distribution of Total Bedrooms')
plt.show()
# 人口
plt.figure(figsize=(8,6))
data['population'].plot(kind='kde')
plt.xlabel('Population')
plt.ylabel('Density')
plt.title('Distribution of Population')
plt.show()
# 家庭数
plt.figure(figsize=(8,6))
data['households'].plot(kind='kde')
plt.xlabel('Households')
plt.ylabel('Density')
plt.title('Distribution of Households')
plt.show()
# 收入中位数
plt.figure(figsize=(8,6))
data['median_income'].plot(kind='kde')
plt.xlabel('Median Income')
plt.ylabel('Density')
plt.title('Distribution of Median Income')
plt.show()
# 房价中位数
plt.figure(figsize=(8,6))
data['median_house_value'].plot(kind='kde')
plt.xlabel('Median House Value')
plt.ylabel('Density')
plt.title('Distribution of Median House Value')
plt.show()
```
这些代码将展示每个特征的直方图或密度图,能够更直观地了解每个特征的分布情况。