pandas中apply函数的使用方法及作用
时间: 2023-07-15 16:10:42 浏览: 103
在pandas中,apply()函数可以应用于数据帧(DataFrame)和系列(Series)。它的主要作用是将一个函数应用于数据帧中的每一行或每一列,并返回一个新的数据帧或系列。
apply()函数的语法如下:
```
DataFrame.apply(func, axis=0, raw=False, result_type=None, args=(), **kwds)
```
其中,参数的含义如下:
- func:要应用于每个元素的函数。
- axis:指定函数沿着哪个轴应用。0表示按列应用,1表示按行应用。
- raw:如果为True,则传递每行/列作为一个数组给函数。如果为False(默认),则传递一个Series对象。
- result_type:指定返回的类型。可以是‘expand’(默认),将返回一个数据帧,或‘reduce’,将返回一个系列。
- args:传递给函数的其他参数。
例如,我们可以使用apply()函数来计算数据帧每列的平均值,代码如下:
```
import pandas as pd
data = {'A': [1, 2, 3], 'B': [4, 5, 6]}
df = pd.DataFrame(data)
# 计算每列的平均值
mean = df.apply(lambda x: x.mean(), axis=0)
print(mean)
```
输出:
```
A 2.0
B 5.0
dtype: float64
```
在这个例子中,我们使用lambda函数计算每列的平均值,并将axis参数设置为0以沿着列应用函数。函数返回一个系列,其中包含每列的平均值。
需要注意的是,apply()函数是一种比较耗时的操作,因此在处理大量数据时需要谨慎使用。
阅读全文