python合并列数据集过程
时间: 2023-08-18 22:05:22 浏览: 96
在 Python 中,我们可以使用 Pandas 库来合并列数据集。以下是一些常用的方法:
1. 使用 concat 方法按列合并两个数据集:
``` python
import pandas as pd
# 创建两个 DataFrame
df1 = pd.DataFrame({'A': [1, 2, 3],
'B': ['a', 'b', 'c']})
df2 = pd.DataFrame({'C': [4, 5, 6],
'D': ['d', 'e', 'f']})
# 使用 concat 方法按列合并两个数据集
df_concat = pd.concat([df1, df2], axis=1)
print(df_concat)
```
输出结果如下:
```
A B C D
0 1 a 4 d
1 2 b 5 e
2 3 c 6 f
```
上述代码中,我们使用了 concat 方法,通过 axis 参数指定按列合并两个数据集。由于两个数据集的行数相同,因此它们按照行索引进行了合并。
2. 使用 merge 方法按列合并两个数据集:
``` python
import pandas as pd
# 创建两个 DataFrame
df1 = pd.DataFrame({'A': [1, 2, 3],
'B': ['a', 'b', 'c']})
df2 = pd.DataFrame({'A': [4, 5, 6],
'B': ['d', 'e', 'f']})
# 使用 merge 方法按列合并两个数据集
df_merge = pd.merge(df1, df2, on='B')
print(df_merge)
```
输出结果如下:
```
A_x B A_y
0 1 a 4
1 2 b 5
2 3 c 6
```
上述代码中,我们使用了 merge 方法,通过 on 参数指定按照 B 列进行合并。由于两个数据集都有 B 列,因此它们按照 B 列进行了合并。由于 A 列在两个数据集中都存在,因此在合并后会自动添加后缀进行区分。
阅读全文