import matplotlib.pyplot as plt import pandas as pd plt.rcParams['font.family']='sans-serif' plt.rcParams['font.sans-serif'] = ['Simhei'] plt.rcParams['axes.unicode_minus'] = False filename = "../task/ershoufang_jinan_utf8_clean.csv" names = ["id","communityName","areaName","total","unitPriceValue", "fwhx","szlc","jzmj","hxjg","tnmj", "jzlx","fwcx","jzjg","zxqk","thbl", "pbdt","cqnx","gpsj","jyqs","scjy", "fwyt","fwnx","cqss","dyxx","fbbj", "aa","bb","cc","dd"] miss_value = ["null","暂无数据"] df = pd.read_csv(filename,header=None, skiprows=[0],names=names,na_values=miss_value) 步骤一:二手房单价箱线图 通过箱线图分析二手房单价在各个区域的对比。 """各区域二手房单价箱线图""" #数据分组、数据运算和聚合 box_unitprice_area = df["unitPriceValue"].groupby(df["areaName"]) flag = True box_data = pd.DataFrame(list(range(21000)),columns=["start"]) for name,group in box_unitprice_area: box_data[name] = group del box_data["start"] fig = plt.figure(figsize=(12,7)) ax = fig.add_subplot(111) ax.set_ylabel("总价(万元)",fontsize=14) ax.set_title("各区域二手房单价箱线图",fontsize=18) box_data.plot(kind="box",fontsize=12,sym='r+',grid=True,ax=ax,yticks=[20000,30000,40000,50000,100000]) 可以对比济南各个区的二手房均价和分布。 步骤二:二手房总价箱线图 通过箱线图分析二手房总价在各个区域的对比。 参照下面的提示补全缺失的代码: # 仿照上面的代码,按地区对二手房总价进行归类
时间: 2023-07-22 15:09:07 浏览: 49
请将代码补充如下:
```python
"""各区域二手房总价箱线图"""
box_totalprice_area = df["total"].groupby(df["areaName"])
box_total_data = pd.DataFrame(list(range(21000)), columns=["start"])
for name, group in box_totalprice_area:
box_total_data[name] = group
del box_total_data["start"]
fig = plt.figure(figsize=(12,7))
ax = fig.add_subplot(111)
ax.set_ylabel("总价(万元)", fontsize=14)
ax.set_title("各区域二手房总价箱线图", fontsize=18)
box_total_data.plot(kind="box", fontsize=12, sym='r+', grid=True, ax=ax, yticks=[0, 100, 200, 300, 400])
```
这样就可以绘制各区域二手房总价的箱线图了。
相关问题
import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt plt.rcParams['font.sans-serif'] = ['SimHei'] plt.rcParams['axes.unicode_minus']=False %matplotlib inline
这段代码主要是进行Python数据分析所需要引入的常用库的导入和设置matplotlib图表显示中文的字体和解决负号显示问题,同时使用%matplotlib inline命令设置图表以内嵌形式显示在notebook页面中。其中,numpy是Python中处理科学计算的一个重要库,pandas是Python中用于数据分析的库,seaborn是基于matplotlib的数据可视化库,matplotlib是Python中常用的绘图库。
import matplotlib.pyplot as plt import pandas as pd plt.rcParams['font.sans-serif']=['Arial Unicode MS'] plt.rcParams['axes.unicode_minus']=False df = pd.read_csv("vehicles-数据.csv",encoding='gbk') x = df["fuelType"].values大多数车是哪种类型?展示每种燃料类型汽车的数量
根据您提供的代码和数据,可以通过以下代码展示每种燃料类型汽车的数量:
```
import matplotlib.pyplot as plt
import pandas as pd
plt.rcParams['font.sans-serif']=['Arial Unicode MS']
plt.rcParams['axes.unicode_minus']=False
df = pd.read_csv("vehicles-数据.csv", encoding='gbk')
fuel_counts = df['fuelType'].value_counts()
plt.bar(fuel_counts.index, fuel_counts.values)
plt.title("不同燃料类型汽车数量")
plt.xlabel("燃料类型")
plt.ylabel("数量")
plt.show()
```
运行后,会生成一个柱状图,横轴为不同的燃料类型,纵轴为该燃料类型汽车的数量。您可以根据具体业务需求进行图表样式的修改。