求dataframe的两列数据的平均值,生成新的一列
时间: 2023-02-08 19:09:39 浏览: 243
pyspark给dataframe增加新的一列的实现示例
可以使用pandas库中的`assign()`函数来实现。
语法如下:
```
dataframe.assign(new_column_name = lambda x: (x['column1'] + x['column2']) / 2)
```
其中,`new_column_name` 是新增加的列的名称,`column1`和`column2`是需要求平均值的两列。
例如:
```
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df = df.assign(avg = lambda x: (x['A'] + x['B']) / 2)
print(df)
```
输出:
```
A B avg
0 1 4 2.5
1 2 5 3.5
2 3 6 4.5
```
新增加了一列 avg,里面存放 A 列和 B 列的平均值
阅读全文