groupby之后如何查找每个样本的数量
时间: 2024-10-15 08:30:15 浏览: 19
Oracle分析函数基本概念和语法总结及Regexp_***用法
5星 · 资源好评率100%
在Pandas中,如果你想要了解每个分组(groupby)内每个样本(观测值)的数量,你可以使用`size()`或`.count()`方法。这两个方法都会返回一个新的Series,其中索引是原数据集的分组标签,值则是每个分组中观测值的数量。
例如,假设你有一个名为`df`的DataFrame,你想按照某个列`column_name`进行分组,并获取每个组内的行数,可以这样做:
```python
sample_counts = df.groupby('column_name').size()
```
或者更简洁地:
```python
sample_counts = df.groupby('column_name')['index_column_name'].count() # 如果需要统计的是DataFrame的行索引
```
这里,`'index_column_name'`应该替换为实际的行索引名称(默认为`Index`,如果你的数据框的索引名不是默认的`RangeIndex`)。
如果你想得到一个DataFrame,可以直接将结果转换为DataFrame:
```python
sample_counts = df.groupby('column_name').size().reset_index(name='Count')
```
这将创建一个新的DataFrame,其中包含了分组列以及对应的计数。
阅读全文