pandas聚合函数代码
时间: 2024-04-18 15:22:13 浏览: 108
当处理大量数据时,pandas是一个非常强大的Python库。它提供了各种聚合函数,用于对数据进行分组和汇总。以下是一些常用的pandas聚合函数及其代码示例:
1. sum():计算数据的总和。
```python
import pandas as pd
# 创建一个DataFrame
data = {'A': [1, 2, 3, 4, 5],
'B': [10, 20, 30, 40, 50]}
df = pd.DataFrame(data)
# 计算列A和列B的总和
sum_A = df['A'].sum()
sum_B = df['B'].sum()
print("列A的总和:", sum_A)
print("列B的总和:", sum_B)
```
2. mean():计算数据的平均值。
```python
import pandas as pd
# 创建一个DataFrame
data = {'A': [1, 2, 3, 4, 5],
'B': [10, 20, 30, 40, 50]}
df = pd.DataFrame(data)
# 计算列A和列B的平均值
mean_A = df['A'].mean()
mean_B = df['B'].mean()
print("列A的平均值:", mean_A)
print("列B的平均值:", mean_B)
```
3. max():找出数据的最大值。
```python
import pandas as pd
# 创建一个DataFrame
data = {'A': [1, 2, 3, 4, 5],
'B': [10, 20, 30, 40, 50]}
df = pd.DataFrame(data)
# 找出列A和列B的最大值
max_A = df['A'].max()
max_B = df['B'].max()
print("列A的最大值:", max_A)
print("列B的最大值:", max_B)
```
4. min():找出数据的最小值。
```python
import pandas as pd
# 创建一个DataFrame
data = {'A': [1, 2, 3, 4, 5],
'B': [10, 20, 30, 40, 50]}
df = pd.DataFrame(data)
# 找出列A和列B的最小值
min_A = df['A'].min()
min_B = df['B'].min()
print("列A的最小值:", min_A)
print("列B的最小值:", min_B)
```
5. count():计算非缺失值的数量。
```python
import pandas as pd
# 创建一个DataFrame
data = {'A': [1, 2, None, 4, 5],
'B': [10, None, 30, 40, None]}
df = pd.DataFrame(data)
# 计算列A和列B的非缺失值数量
count_A = df['A'].count()
count_B = df['B'].count()
print("列A的非缺失值数量:", count_A)
print("列B的非缺失值数量:", count_B)
```
以上是一些常用的pandas聚合函数示例。你可以根据具体需求选择适合的函数来进行数据分组和汇总。
阅读全文