针对xlsx文件用python对毕业学校非北京科技大学的学生进行分析,分别累加各个毕业学校学生数量给出数据,并绘制柱状图
时间: 2024-11-20 19:55:14 浏览: 25
在Python中,我们可以使用pandas库来处理Excel (xlsx) 文件中的数据,对于这种特定任务,可以按照以下步骤操作:
1. **导入必要的库**:
```python
import pandas as pd
import matplotlib.pyplot as plt
```
2. **读取xlsx文件**:
```python
data = pd.read_excel('file.xlsx', sheet_name='Sheet1') # 假设数据在第一个工作表
```
3. **筛选非北京科技大学的学生**:
```python
bkstu_df = data[data['毕业学校'] != '北京科技大学']
```
4. **按毕业学校分组并计数**:
```python
count_data = bkstu_df.groupby('毕业学校')['毕业生姓名'].nunique()
```
5. **累计各校学生数量**:
```python
cumulative_counts = count_data.cumsum()
```
6. **绘制柱状图**:
```python
plt.figure(figsize=(10, 6))
cumulative_counts.plot(kind='bar', title='累计非北京科技大学各毕业学校学生数量')
plt.xlabel('毕业学校')
plt.ylabel('累计人数')
plt.show()
```
在这个过程中,假设`'毕业生姓名'`列存储了学生的姓名信息,而`'毕业学校'`列包含他们的毕业院校。
阅读全文