dataframe,以表A的两列数据重新生成一个表B
时间: 2024-02-25 16:53:21 浏览: 10
好的,我明白了。针对您的问题,我可以提供以下 Python 代码示例,利用 Pandas 库将表 A 的两列数据重新生成一个新的表 B:
```python
import pandas as pd
# 读取表 A 的数据
df_a = pd.read_csv('table_a.csv')
# 选取需要的两列数据并生成新的表 B
df_b = df_a[['column1', 'column2']]
# 将表 B 保存为 CSV 文件
df_b.to_csv('table_b.csv', index=False)
```
其中,您需要将上述代码中的 'table_a.csv' 替换为您实际的表 A 文件路径,将 'column1' 和 'column2' 替换为您实际需要的两列数据的列名,将 'table_b.csv' 替换为您希望保存表 B 的文件路径和文件名。请确保您已经安装了 Pandas 库,并且在代码中进行了正确的导入。
相关问题
求dataframe的两列数据的平均值,生成新的一列
可以使用pandas库中的`assign()`函数来实现。
语法如下:
```
dataframe.assign(new_column_name = lambda x: (x['column1'] + x['column2']) / 2)
```
其中,`new_column_name` 是新增加的列的名称,`column1`和`column2`是需要求平均值的两列。
例如:
```
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df = df.assign(avg = lambda x: (x['A'] + x['B']) / 2)
print(df)
```
输出:
```
A B avg
0 1 4 2.5
1 2 5 3.5
2 3 6 4.5
```
新增加了一列 avg,里面存放 A 列和 B 列的平均值
按照列名同时读取dataframe的两列数据
可以使用`loc`方法同时读取多列数据,例如:
```python
import pandas as pd
# 生成样例数据
df = pd.DataFrame({'col1': [1, 2, 3], 'col2': ['a', 'b', 'c']})
# 同时读取 'col1' 和 'col2' 列的数据
data = df.loc[:, ['col1', 'col2']]
```
此时 `data` 就是同时包含了 'col1' 和 'col2' 列数据的新 dataframe。