import pandas as pd no=pd.DataFrame(df3[df3['Exited']==0].groupby(by='Tenure'). value_counts()/len(df3.index)*100) no.index=[0,1,2,3,4,5,6,7,8,9,10] no.colums=['未流失'] yes=pd.DataFrame(df3[df3['Exited']==1].groubpy(by='Tenure'). value_counts()/len(df3.index)*100) yes.columns=['已流失'] zj=pd.concat([no,yes],axis=1) zj.plot(kind='bar',rot=(),figsize=(10,5)) plt.legend(['未流失','已流失']) plt.xlabel('客户的时长',x=1.05) plt.ylabel('占比量',y=1.05,rotation=360)
时间: 2023-06-26 16:05:03 浏览: 277
pyspark.sql.DataFrame与pandas.DataFrame之间的相互转换实例
5星 · 资源好评率100%
这段代码是用来画一个关于客户流失和客户时长的柱状图。其中,首先通过筛选将数据分为已流失和未流失两组,然后对于每组数据,根据客户在银行的时长(Tenure)进行分组,并计算出每个时长分组内的记录占总记录数的百分比。接着,将已流失和未流失的数据合并为一个DataFrame,并用plot函数画出柱状图。其中,'bar'表示画柱状图,'rot'表示旋转x轴刻度标签,'figsize'表示图的大小,plt.legend用来设置图例,plt.xlabel和plt.ylabel用来设置x轴和y轴的标签。
阅读全文