loan.csv月收入的空值去掉,然后按区间划分'0-5000','5000-10000','10000-30000','30000以上'绘制一个圆环图
时间: 2024-11-25 21:04:08 浏览: 0
首先,我们需要加载`loan.csv`文件,并处理其中月收入(假设列名为"Income")的缺失值。在Python中,可以使用pandas库完成这个任务。假设数据已经读入DataFrame `df`:
```python
import pandas as pd
# 加载数据并检查是否有空值
df = pd.read_csv('loan.csv')
if 'Income' in df.columns and df['Income'].isnull().sum() > 0:
# 如果存在空值,替换为某个合理的值(这里以0代替,实际可根据情况填充)
df['Income'] = df['Income'].fillna(0)
# 定义收入区间划分
income_ranges = ['0-5000', '5000-10000', '10000-30000', '30000以上']
bins = [0, 5000, 10000, 30000, float('inf')] # 区间边界包括上限
# 按照区间划分并计数
income_counts = df['Income'].apply(lambda x: income_ranges[min(bins.index(x) + 1, len(bins) - 1)])
# 绘制圆环图
import matplotlib.pyplot as plt
plt.pie(income_counts.value_counts(), labels=income_ranges, autopct='%1.1f%%', startangle=90, radius=1)
plt.title('贷款人群月收入分布')
plt.axis('equal') # 保持圆形比例
plt.show()
```
在这个例子中,我们假设月收入的范围从0开始划分,如果有未知或异常值,可能需要先进行清理。绘制完成后,你会得到一个表示不同收入区间人数占比的圆环图。
阅读全文