dataframe如何用几列数据的求和生成新列
时间: 2024-02-24 09:54:09 浏览: 19
可以使用pandas库中的DataFrame的apply()方法来对几列数据求和生成新列。具体操作如下:
假设我们有一个DataFrame df,其中有三列数据 a、b、c,我们需要对a、b、c这三列数据求和生成新列d,可以使用以下代码:
```
df['d'] = df.apply(lambda row: row['a'] + row['b'] + row['c'], axis=1)
```
其中,lambda函数用来对每一行数据进行求和,axis=1表示对每一行进行操作。
执行完上述代码后,新列d就会被添加到DataFrame中,每一行的值为该行对应的a、b、c三列数据的和。
相关问题
dataframe使用多行数据生成新列
在 Pandas 中,可以使用 apply 方法和 lambda 函数来生成新列。
例如:假设有一个名为 "df" 的数据框,其中有两列 "A" 和 "B"。
```
df['C'] = df.apply(lambda row: row['A'] + row['B'], axis=1)
```
这会在数据框中创建一个名为 "C" 的新列,其中每个单元格的值是 "A" 列和 "B" 列对应行的单元格值之和。
pycharm 读取dataframe 某几列数据
可以使用dataframe的loc或iloc方法选择需要的列。
loc方法使用列名作为索引,例如:
```python
import pandas as pd
df = pd.read_csv('data.csv')
# 选择第一列和第三列
df = df.loc[:, ['col1', 'col3']]
```
iloc方法使用列的位置作为索引,例如:
```python
import pandas as pd
df = pd.read_csv('data.csv')
# 选择第一列和第三列
df = df.iloc[:, [0, 2]]
```
以上代码分别选择了dataframe的第一列和第三列作为新的dataframe。