pandas利用数据透视表,统计各区域各类户型的平均价格
时间: 2023-08-17 17:26:36 浏览: 48
可以使用 pandas 中的 `pivot_table()` 方法来实现数据透视表的统计功能。代码示例如下:
```python
import pandas as pd
# 读取数据
data = pd.read_csv('data.csv')
# 使用数据透视表统计各区域各类户型的平均价格
result = pd.pivot_table(data, values='价格', index='区域', columns='户型', aggfunc='mean')
# 打印统计结果
print(result)
```
其中,`pivot_table()` 方法的第一个参数为要进行统计的数据框,第二个参数为要统计的数值列,第三个参数为行索引,第四个参数为列索引,第五个参数为统计方法。上述代码中,我们将数据透视表的行索引设置为 "区域" 列,列索引设置为 "户型" 列,统计方法为平均值。最终得到的 `result` 数据框即为各区域各类户型的平均价格。
相关问题
生成代码:读取租房数据原始文件zfsj_group.csv,并利用数据透视表统计各区域各类户型平均价格
可以使用Python的pandas库来读取csv文件并进行数据透视表分析。以下是代码示例:
```python
import pandas as pd
# 读取csv文件,假设文件名为zfsj_group.csv,编码为utf-8
df = pd.read_csv("zfsj_group.csv", encoding="utf-8")
# 进行数据透视表分析,统计各区域各类户型平均价格
result = pd.pivot_table(df, values="price", index=["region"], columns=["type"], aggfunc="mean")
print(result)
```
其中,`pd.read_csv()`函数用于读取csv文件,`pd.pivot_table()`函数用于进行数据透视表分析。在`pd.pivot_table()`函数中,`values`参数指定需要统计的数值列,`index`参数指定行索引,`columns`参数指定列索引,`aggfunc`参数指定聚合函数(这里使用了求平均值的函数"mean")。
以上代码执行后,会输出各区域各类户型平均价格的数据透视表。
pandas对数据透视表中的数据按价格也降序排列
可以使用 pandas 中的 `sort_values()` 方法来对数据透视表中的数据按价格降序排列。代码示例如下:
```python
import pandas as pd
# 读取数据
data = pd.read_csv('data.csv')
# 使用数据透视表统计各区域各类户型的平均价格
result = pd.pivot_table(data, values='价格', index='区域', columns='户型', aggfunc='mean')
# 对数据按价格降序排列
result = result.sort_values(by='价格', ascending=False)
# 打印统计结果
print(result)
```
其中,`sort_values()` 方法的第一个参数为要排序的列名,第二个参数为排序方式,`ascending=False` 表示按降序排列。上述代码中,我们将数据透视表中的数据按价格降序排列。最终得到的 `result` 数据框即为各区域各类户型的平均价格,且按价格降序排列。
阅读全文