统计df中no_id中的no_national_id的sa_id的数量,no_idphoto列中no_national_idCard的sa_id的数量
时间: 2024-10-05 17:03:31 浏览: 34
MATLAB DONLOD.zip_DFB_colortog_laser MATLAB_matlab dfb_matlab中DF
在Pandas DataFrame `df` 中,如果你想要统计 `no_id` 列中 `no_national_id` 子字符串出现的次数,以及 `no_idphoto` 列中 `no_national_idCard` 子字符串对应的 `sa_id` 的数量,你可以使用以下步骤:
```python
# 首先,假设 'sa_id' 在 'no_id' 或 'no_idphoto' 列中都是一一对应的
count_no_national_id = df['no_id'].str.contains('no_national_id').sum()
count_sa_ids = df[df['no_idphoto'].str.contains('no_national_idCard')]['sa_id'].nunique()
count_no_national_id, count_sa_ids
```
这里我们通过`.str.contains()` 方法检查每个行中是否包含指定的子串,然后计算总匹配数(`sum()`),对于 `no_idphoto` 列,我们筛选出含有特定子串的行,并计算 `sa_id` 的唯一值(`nunique()`)。
阅读全文