pandas分组统计结果为新的一列
时间: 2023-08-15 22:20:43 浏览: 92
可以使用 `pandas` 的 `groupby` 和 `agg` 方法来实现,例如:
```
import pandas as pd
# 创建一个示例数据集
data = {'group': ['A', 'A', 'B', 'B'], 'value': [1, 2, 3, 4]}
df = pd.DataFrame(data)
# 使用 groupby 和 agg 进行分组统计,并将结果存储为新的一列
df['group_sum'] = df.groupby('group')['value'].agg('sum')
```
这样就会生成一个名为 `group_sum` 的新列,其中存储了按照 `group` 列进行分组后,每组中 `value` 列的总和。
相关问题
pandas分组统计某一列每个元素出现的次数
好的,这是一个关于数据分析的问题。可以通过groupby函数进行分组,并使用value_counts函数统计每个元素出现的次数。示例如下:
```
import pandas as pd
df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],
'B': ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'],
'C': [1, 2, 2, 1, 1, 2, 2, 1]})
result = df.groupby('C')['B'].value_counts()
print(result)
```
输出结果是:
```
C B
1 three 2
one 1
2 two 2
bar 2
foo 1
Name: B, dtype: int64
```
希望这个回答能对您有所帮助。
pandas分组统计某列元素个数
要对某列进行分组统计元素个数,可以使用 Pandas 库中的 `groupby()` 方法结合 `size()` 方法。以下是一个示例:
假设有一个 DataFrame 名为 `df`,其中有两列,分别为 `column_name1` 和 `column_name2`,我们想要对 `column_name1` 进行分组统计元素个数,可以使用以下代码:
```python
df.groupby('column_name1').size()
```
上述代码将按照 `column_name1` 列的不同值进行分组,并统计每个组中的元素个数。
如果你还想要将结果保存到一个新的 DataFrame 中,可以使用 `reset_index()` 方法,例如:
```python
new_df = df.groupby('column_name1').size().reset_index(name='count')
```
这将创建一个新的 DataFrame,其中包含两列,一列为 `column_name1` 中的唯一值,另一列为每个值对应的元素个数。你可以将 `name` 参数设置为你想要的列名。
阅读全文