各区二手房数量和均价析,根据以下要求进行分析 (1)导入“最新发布的北京二手房数据_预处理.xlsx”文件中的数据,并设置中文字体。 (2)创建新画布,设置大小为(12, 6)。 (3)将数据按所在区分组,并使用size()函数获取每个分组的统计个数;然后,创建一行一列的子图ax1,以统计个数的行标签为x轴数据、数值为y轴数据、颜色为(0.894, 0, 0.498)绘制柱状图,并设置y轴标题、图例和图表标题。 (4)将数据按所在区分组,并将分组数据的单价列按均值聚合,然后使用twinx()函数创建一个共享x轴的子图ax2,以均值为y轴数据、蓝色点画线星号为线条样式绘制折线图,并设置y轴标题、图例和每个数据的文本标签。
时间: 2024-02-20 20:57:41 浏览: 12
很抱歉,作为AI语言模型,我无法直接导入和处理数据,但我可以给你提供Python代码的实现示例,你可以在适当的环境下运行它们。以下是示例代码:
```python
import pandas as pd
import matplotlib.pyplot as plt
# 设置中文字体
plt.rcParams['font.family'] = 'SimHei'
# 导入数据
df = pd.read_excel('最新发布的北京二手房数据_预处理.xlsx')
# 按所在区分组并使用size()函数获取每个分组的统计个数
grouped_df = df.groupby('所在区').size().reset_index(name='数量')
# 创建画布并设置大小
fig, ax1 = plt.subplots(figsize=(12, 6))
# 绘制柱状图
ax1.bar(grouped_df['所在区'], grouped_df['数量'], color=(0.894, 0, 0.498))
ax1.set_ylabel('数量')
ax1.set_xlabel('所在区')
ax1.set_title('各区二手房数量')
# 将数据按所在区分组并将分组数据的单价列按均值聚合
grouped_df = df.groupby('所在区')['单价'].mean().reset_index(name='均价')
# 创建共享x轴的子图
ax2 = ax1.twinx()
# 绘制折线图
ax2.plot(grouped_df['所在区'], grouped_df['均价'], 'bp-', label='均价')
ax2.set_ylabel('均价(元/平米)')
ax2.set_title('各区二手房均价')
ax2.legend(loc='upper right')
# 添加每个数据的文本标签
for x, y in zip(grouped_df['所在区'], grouped_df['均价']):
ax2.text(x, y, f'{y:.0f}', ha='center', va='bottom')
plt.show()
```
希望能对你有所帮助!