统计df中no_id中的no_national_id的sa_id的数量
时间: 2024-10-05 09:03:31 浏览: 48
如果你想统计 DataFrame (`df`) 中某个列(`no_id`) 下的另一个列(`no_national_id`) 对应的 `sa_id` 数量,你可以使用以下步骤:
1. 确保 `no_id` 和 `no_national_id` 是 DataFrame 的列名。
2. 使用 `groupby` 方法按 `no_national_id` 分组,并计算每个组的 `sa_id` 的数目:
```python
count_per_national_id = df.groupby('no_national_id')['sa_id'].count()
```
这将返回一个新的 Series,其中索引是 `no_national_id`,值是对应 `sa_id` 的数量。
3. 如果你想要得到一个单独的数据框,包含原始 `no_national_id` 以及对应的 `sa_id` 数量,可以加上 `.reset_index()`:
```python
result_df = count_per_national_id.reset_index(name='sa_id_count')
```
4. 结果 `result_df` 现在包含了每个 `no_national_id` 对应的 `sa_id` 数量。
完整的例子:
```python
count_df = df.groupby('no_national_id')['sa_id'].count().reset_index(name='sa_id_count')
```
```python
阅读全文