首页dataframe不重复计数.groupby

dataframe不重复计数.groupby

时间: 2023-08-29 20:07:11 浏览: 102

使用`groupby`和`nunique`函数可以对DataFrame的某一列进行不重复计数。例如，假设有以下的DataFrame： ``` import pandas as pd data = {'name': ['Alice', 'Bob', 'Charlie', 'Alice', 'Charlie', 'David', 'Bob'], 'gender': ['female', 'male', 'male', 'female', 'male', 'male', 'male']} df = pd.DataFrame(data) print(df) ``` 输出： ``` name gender 0 Alice female 1 Bob male 2 Charlie male 3 Alice female 4 Charlie male 5 David male 6 Bob male ``` 现在想要计算每个名字出现的次数，可以使用以下代码： ``` name_counts = df.groupby('name')['gender'].nunique() print(name_counts) ``` 输出： ``` name Alice 1 Bob 1 Charlie 1 David 1 Name: gender, dtype: int64 ``` 这里使用了`groupby`函数将DataFrame按照`name`列进行分组，然后使用`nunique`函数计算不重复的`gender`值的数量。最终结果显示每个名字出现的次数为1，因为我们只考虑了不重复的`gender`值。

阅读全文