dataframe不重复计数.groupby
时间: 2023-08-29 19:07:11 浏览: 99
对DataFrame数据中的重复行,利用groupby累加合并的方法详解
5星 · 资源好评率100%
使用`groupby`和`nunique`函数可以对DataFrame的某一列进行不重复计数。
例如,假设有以下的DataFrame:
```
import pandas as pd
data = {'name': ['Alice', 'Bob', 'Charlie', 'Alice', 'Charlie', 'David', 'Bob'],
'gender': ['female', 'male', 'male', 'female', 'male', 'male', 'male']}
df = pd.DataFrame(data)
print(df)
```
输出:
```
name gender
0 Alice female
1 Bob male
2 Charlie male
3 Alice female
4 Charlie male
5 David male
6 Bob male
```
现在想要计算每个名字出现的次数,可以使用以下代码:
```
name_counts = df.groupby('name')['gender'].nunique()
print(name_counts)
```
输出:
```
name
Alice 1
Bob 1
Charlie 1
David 1
Name: gender, dtype: int64
```
这里使用了`groupby`函数将DataFrame按照`name`列进行分组,然后使用`nunique`函数计算不重复的`gender`值的数量。最终结果显示每个名字出现的次数为1,因为我们只考虑了不重复的`gender`值。
阅读全文