使用python对给定数据集某地区房屋销售数据.csv,完成如下题目: (1)计算房屋价格70000以上的数量并找出最贵价格房屋的地区编码。 (2)计算房屋出售时间在2013年的数量,并计算该年房屋价格的平均值
时间: 2024-04-30 12:17:55 浏览: 15
首先,我们需要读取 csv 文件,可以使用 pandas 库来进行读取和处理:
```python
import pandas as pd
data = pd.read_csv('某地区房屋销售数据.csv')
```
接下来,我们可以完成第一问:
```python
# 计算房屋价格70000以上的数量
num_above_70000 = len(data[data['价格'] >= 70000])
print('房屋价格70000以上的数量为:', num_above_70000)
# 找出最贵价格房屋的地区编码
max_price = data['价格'].max()
max_price_area = data.loc[data['价格'] == max_price]['地区编码'].values[0]
print('最贵价格房屋的地区编码为:', max_price_area)
```
这里我们使用了 Pandas 的 DataFrame 进行条件筛选,得到了价格在 70000 以上的房屋数量,然后使用 `max()` 函数找到最高价格,并且使用 `.loc[]` 方法找到最高价格对应的行,并取出地区编码。
接下来,我们可以完成第二问:
```python
# 计算房屋出售时间在2013年的数量
num_in_2013 = len(data[data['销售时间'].str.startswith('2013')]) # '2013' 表示字符串起始的年份
print('房屋出售时间在2013年的数量为:', num_in_2013)
# 计算该年房屋价格的平均值
price_in_2013 = data[data['销售时间'].str.startswith('2013')]['价格']
avg_price_in_2013 = price_in_2013.mean()
print('该年房屋价格的平均值为:', avg_price_in_2013)
```
这里我们使用了 Pandas 的字符串方法 `str.startswith()` 来筛选出销售时间在 2013 年的房屋数量,然后取出价格列,并使用 `.mean()` 方法计算平均值。
完整代码如下:
```python
import pandas as pd
data = pd.read_csv('某地区房屋销售数据.csv')
# 计算房屋价格70000以上的数量
num_above_70000 = len(data[data['价格'] >= 70000])
print('房屋价格70000以上的数量为:', num_above_70000)
# 找出最贵价格房屋的地区编码
max_price = data['价格'].max()
max_price_area = data.loc[data['价格'] == max_price]['地区编码'].values[0]
print('最贵价格房屋的地区编码为:', max_price_area)
# 计算房屋出售时间在2013年的数量
num_in_2013 = len(data[data['销售时间'].str.startswith('2013')]) # '2013' 表示字符串起始的年份
print('房屋出售时间在2013年的数量为:', num_in_2013)
# 计算该年房屋价格的平均值
price_in_2013 = data[data['销售时间'].str.startswith('2013')]['价格']
avg_price_in_2013 = price_in_2013.mean()
print('该年房屋价格的平均值为:', avg_price_in_2013)
```