使用python统计Excel表格中数据最少的五个项目,通过直方图显示
时间: 2024-05-08 12:15:34 浏览: 76
以下是一种可能的实现方法:
```python
import pandas as pd
import matplotlib.pyplot as plt
# 读取Excel表格
df = pd.read_excel('example.xlsx', sheet_name='Sheet1')
# 统计每个项目的非空数据个数并排序
counts = df.count().sort_values()
# 取出最少的五个项目
top_5 = counts.head(5)
# 输出结果
print('最少的五个项目:')
print(top_5)
# 画直方图
plt.bar(top_5.index, top_5.values)
plt.title('Top 5 Projects with Least Data')
plt.xlabel('Project')
plt.ylabel('Number of Non-Null Data')
plt.show()
```
解释一下代码:
1. 第1行导入了`pandas`和`matplotlib.pyplot`两个库。
2. 第4行使用`pd.read_excel()`函数读取Excel表格中的数据,并存储在一个`DataFrame`对象中。`sheet_name`参数指定了要读取的工作表的名称。
3. 第7行使用`count()`方法统计每个项目的非空数据个数。`sort_values()`方法按照统计结果排序。
4. 第10行使用`head(5)`方法取出最少的五个项目。
5. 第13-15行输出结果。
6. 第18-23行使用`plt.bar()`函数画直方图。`top_5.index`和`top_5.values`分别表示最少的五个项目的名称和非空数据个数。`plt.title()`、`plt.xlabel()`和`plt.ylabel()`分别设置标题、x轴标签和y轴标签。`plt.show()`函数显示图形。
阅读全文