pandas读取excel表格,A列是班级的名字,C列统计该班级出现的次数
时间: 2024-12-08 16:16:29 浏览: 16
Python pandas对excel的操作实现示例
要使用pandas读取Excel文件并按A列(班级)计数C列(出现次数),可以按照以下步骤操作:
1. **导入所需库**[^1]
```python
import pandas as pd
```
2. **读取Excel文件**,指定班级所在的列名(如A列对应'df_1$A')
```python
df_1 = pd.read_excel('分组.xlsx', sheet_name=0, usecols=['A', 'C'], dtype=str, keep_default_na='')
```
这里假设'A'列在DataFrame中对应的列名称是'df_1$A',因为实际的列名取决于你的Excel文件。
3. **按班级分组并计算出现次数**
```python
grouped_df = df_1.groupby(df_1['A'])['C'].count()
```
这会创建一个新的Series,其中索引是班级名称,值是该班级在'C'列中出现的次数。
4. **汇总结果**
```python
total_counts = grouped_df.sum()
print(total_counts)
```
这将输出每个班级的总次数。
完整代码示例:
```python
import pandas as pd
# Step 2
df_1 = pd.read_excel('分组.xlsx', sheet_name=0, usecols=['A', 'C'], dtype=str, keep_default_na='')
# Step 3
grouped_df = df_1.groupby(df_1['A'])['C'].count()
# Step 4
total_counts = grouped_df.sum()
print(total_counts)
```
阅读全文