基于网络爬取好的二手房价数据表格,对其中的数据进行分析和处理: 1.针对所给定的数据进行清洗工作,完成数据中的空值删除和特定数据类型转换。 2.采用函数或模块定义,计算给定的数据中,(1)各区的二手房均价;(2)各区二手房数量所占 比例;(3)全市二手房装修程度分析;(4)热门户型均价分析。 绘图显示:(1)各区二手房均价分析柱状图;(2)各区二手房数据所占比例饼图;(3)全市二手 房装修程度直方图;(4)热门户型均价比较条形图。
时间: 2024-03-14 19:45:16 浏览: 57
好的,您的问题是关于数据分析和处理的。我们可以使用Python编程语言来完成这些任务。
首先,我们需要导入一些必要的库,如pandas、numpy、matplotlib等。
```python
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
```
接下来,我们可以读取数据表格并进行必要的清洗工作。
```python
df = pd.read_csv('二手房数据表格.csv')
df.dropna(inplace=True) # 删除空值
df['房屋单价'] = df['房屋单价'].str[:-4].astype('float') # 转换数据类型
df['建筑面积'] = df['建筑面积'].str[:-2].astype('float')
```
现在,我们可以进行数据分析和处理。首先,我们可以计算各区的二手房均价。
```python
avg_price = df.groupby('区域')['房屋单价'].mean().sort_values(ascending=False)
print(avg_price)
```
接下来,我们可以计算各区二手房数量所占比例。
```python
count = df.groupby('区域')['房屋编号'].count().sort_values(ascending=False)
count_ratio = count / count.sum()
print(count_ratio)
```
然后,我们可以进行全市二手房装修程度分析。
```python
decor = df.groupby('装修')['房屋编号'].count()
plt.bar(decor.index, decor.values)
plt.show()
```
最后,我们可以进行热门户型均价分析。
```python
popular = df.groupby('户型')['房屋单价'].mean().sort_values(ascending=False)[:10]
plt.bar(popular.index, popular.values)
plt.show()
```
接下来,我们可以绘制相应的图表。首先,我们可以绘制各区二手房均价分析柱状图。
```python
plt.bar(avg_price.index, avg_price.values)
plt.xticks(rotation=45)
plt.show()
```
然后,我们可以绘制各区二手房数据所占比例饼图。
```python
plt.pie(count_ratio.values, labels=count_ratio.index, autopct='%1.1f%%')
plt.show()
```
接下来,我们可以绘制全市二手房装修程度直方图。
```python
plt.bar(decor.index, decor.values)
plt.show()
```
最后,我们可以绘制热门户型均价比较条形图。
```python
plt.bar(popular.index, popular.values)
plt.show()
```
这样,我们就完成了数据分析和处理的任务,同时也绘制了相应的图表。
阅读全文