pandas 按照某一列数据进行groupby,计算A列 和B列的值。怎么写
时间: 2024-09-26 08:15:29 浏览: 30
Python将DataFrame的某一列作为index的方法
在Pandas中,您可以使用`groupby`函数按照某一列数据对数据进行分组,并计算其他列的值。假设您有一个名为`df`的DataFrame,其中包含两列数据A和B,以及要进行分组的列C。以下是如何使用`groupby`函数来计算A列和B列的值的示例代码:
```python
import pandas as pd
# 假设df是你的DataFrame
df = pd.DataFrame({
'A': ['foo', 'foo', 'foo', 'bar', 'bar', 'bar'],
'B': ['one', 'one', 'two', 'two', 'one', 'one'],
'C': ['small', 'large', 'large', 'small', 'small', 'large'],
'D': [1, 2, 2, 3, 3, 4],
'E': [2, 4, 5, 5, 6, 6]
})
# 按C列进行分组,并计算A列和B列的和
grouped = df.groupby('C')[:].sum()
print(grouped)
```
这段代码首先创建了一个名为`df`的DataFrame,其中包含了一些示例数据。然后,使用`groupby`函数按照C列对数据进行分组,并使用`sum`函数来计算每一组中A列和B列的和。最后,将结果存储在名为`grouped`的变量中,并打印出来。
请注意,上述代码中的`groupby('C')[:]`是必需的,因为它返回的是每一组中的原始数据。如果不这样做,你可能会得到每个唯一值的全集(这可能会影响性能)。在执行任何计算后,你应该将结果保存在一个变量中(例如上述代码中的`grouped`),以避免丢失原始数据。
阅读全文