pandas对身份证号和日期按照出现的次数计数
时间: 2023-08-23 13:58:25 浏览: 185
要使用Pandas对身份证号和日期按出现次数进行数,可以使用`value_counts()`函数以下是一个示例:
```python
import pandas as pd
# 创建包含身份证号和日期的DataFrame
data = {'身份证号': ['111111111111111111', '222222222222222222', '333333333333333333', '111111111111111111'],
'日期': ['2021-01-01', '2021-02-01', '2021-03-01', '2021-01-01']}
df = pd.DataFrame(data)
# 对身份证号进行计数
id_counts = df['身份证号'].value_counts()
# 对日期进行计数
date_counts = df['日期'].value_counts()
# 输出计数结果
print("身份证号计数:")
print(id_counts)
print("\n日期计数:")
print(date_counts)
```
在上述示例中,我们创建了一个包含身份证号和日期的DataFrame。然后,使用`value_counts()`函数对身份证号列和日期列进行计数。最后,我们打印了计数结果。
请注意,`value_counts()`函数会返回一个Series对象,其中包含每个唯一值的计数。你可以根据需要对结果进行进一步的处理或分析。
相关问题
pandas 根据客户的身份证号和体检检查日期,判断客户每次体检的历史检查次数
要根据客户的身份证号和体检检查日期判断客户每次体检的历史检查次数,可以使用 Pandas 的功能进行分组和计数。下面是一个示例:
```python
import pandas as pd
# 创建包含身份证号和体检检查日期的DataFrame
data = {'身份证号': ['111111111111111111', '222222222222222222', '333333333333333333', '111111111111111111'],
'体检日期': ['2021-01-01', '2021-02-01', '2021-03-01', '2021-01-01']}
df = pd.DataFrame(data)
# 将体检日期转换为日期类型
df['体检日期'] = pd.to_datetime(df['体检日期'])
# 根据身份证号和体检日期分组,并计算每组的历史检查次数
df['历史检查次数'] = df.groupby(['身份证号', '体检日期']).cumcount() + 1
# 输出结果
print(df)
```
在上述示例中,我们首先创建了一个包含身份证号和体检检查日期的 DataFrame。然后,我们使用 `pd.to_datetime()` 函数将体检日期转换为日期类型,以便后续的日期计算。
接下来,我们使用 `groupby()` 方法将数据按照身份证号和体检日期进行分组。然后,使用 `cumcount()` 方法计算每个分组的历史检查次数,并将结果存储在新的列 `'历史检查次数'` 中。
最后,我们输出结果 DataFrame,其中包含了每个客户每次体检的历史检查次数。
请注意,这里的示例假设你已经将身份证号和体检日期数据加载到了 Pandas 的 DataFrame 中。你可以根据实际的数据情况进行相应的调整和扩展。
阅读全文