dataframe取一列去重统计个数
时间: 2023-06-28 09:12:24 浏览: 101
假设你的DataFrame为df,取一列名为`column_name`的数据列,可以使用以下代码进行去重并统计个数:
```
count = df['column_name'].nunique()
```
其中,`nunique()`函数返回该列中不同元素的数量,即去重后的元素个数。
相关问题
dataframe取一列去重统计次数
假设你有一个名为 `df` 的 DataFrame,要取其中一列 `column_name` 进行去重并统计每个唯一值出现的次数,可以使用以下代码:
```python
df[column_name].value_counts()
```
其中,`value_counts()` 方法会返回一个 Series 对象,其中包含了每个唯一值出现的次数。如果你想要将结果保存为一个新的 DataFrame,可以使用 `to_frame()` 方法:
```python
df[column_name].value_counts().to_frame()
```
最终,你会得到一个新的 DataFrame,其中包含了 `column_name` 列中每个唯一值出现的次数。
dataframe如何做分组去重统计
您可以使用pandas库来对DataFrame进行分组去重统计,具体可以按照以下步骤进行:
1. 使用groupby()方法对需要分组的列进行分组,例如:
```
grouped = df.groupby('column_name')
```
2. 对分组后的数据使用agg()方法进行聚合操作,例如:
```
result = grouped.agg({'column_name_1': 'count', 'column_name_2': 'nunique'})
```
上面的代码中,我们对两个列进行了聚合操作,其中'column_name_1'列使用了count()函数进行计数,'column_name_2'列使用了nunique()函数去重统计。
3. 最后,您可以使用reset_index()方法将分组后的结果转换为一个新的DataFrame,并且重置索引,例如:
```
result = result.reset_index()
```
这样,您就可以得到一个按照指定列分组后,对其他列进行去重统计的结果。
阅读全文