)导入“最新发布的北京二手房数据_预处理.xlsx”文件中的数据,并设置中文字体。 (2)创建新画布,设置大小为(12, 6)。 (3)将数据按所在区分组,并使用size()函数获取每个分组的统计个数;然后,创建一行一列的子图ax1,以统计个数的行标签为x轴数据、数值为y轴数据、颜色为(0.894, 0, 0.498)绘制柱状图,并设置y轴标题、图例和图表标题。
时间: 2024-02-20 13:56:58 浏览: 107
基于北京二手房价数据的探索性数据分析和房价评估——项目代码
好的,下面是完整代码实现:
```python
import pandas as pd
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei'] # 设置中文字体为黑体
# 导入数据
df = pd.read_excel('最新发布的北京二手房数据_预处理.xlsx')
# 创建画布
fig, ax = plt.subplots(figsize=(12,6))
# 按区分组并计数
count_by_region = df.groupby('区')['区'].size()
# 创建子图
ax1 = fig.add_subplot(111)
ax1.bar(count_by_region.index, count_by_region.values, color=(0.894, 0, 0.498))
# 设置y轴标题、图例和图表标题
ax1.set_ylabel('二手房数量')
ax1.legend(['数量'])
ax1.set_title('北京各区二手房数量分布图')
# 显示图表
plt.show()
```
这段代码会导入Excel文件中的数据,并设置中文字体为黑体。接着,创建一个大小为(12,6)的画布。然后,按照区进行分组,并使用size()函数计算每个分组的统计个数。接着,创建一个一行一列的子图ax1,将分组结果的行标签作为x轴数据、数值作为y轴数据,颜色为(0.894, 0, 0.498)绘制柱状图。最后,设置y轴标题、图例和图表标题,并显示图表。
阅读全文