python表连接,去除重复列
时间: 2023-10-20 13:15:20 浏览: 60
要连接两个表,可以使用pandas库中的merge()函数。假设有两个表A和B,它们都有一个共同的列名为"key",可以使用以下代码将它们连接起来:
```
import pandas as pd
# 创建表A
A = pd.DataFrame({'key': ['A', 'B', 'C', 'D'],
'value': [1, 2, 3, 4]})
# 创建表B
B = pd.DataFrame({'key': ['C', 'D', 'E', 'F'],
'value': [5, 6, 7, 8]})
# 连接表A和表B
merged = pd.merge(A, B, on='key')
print(merged)
```
输出结果为:
```
key value_x value_y
0 C 3 5
1 D 4 6
```
其中,参数on指定连接的列名。在这个例子中,连接的键为"key"列。连接后,会生成一个新的表,包含了所有在表A和表B中都存在的"key"值,并将两个表中对应的行合并到一起。可以看到,连接后的表中包含了"key"、"value_x"和"value_y"三列,其中"value_x"和"value_y"分别表示原来的表A和表B中的"value"列。
如果希望去除重复的列,可以使用drop()函数。例如,可以使用以下代码去除"value_x"列:
```
merged = merged.drop('value_x', axis=1)
print(merged)
```
输出结果为:
```
key value_y
0 C 5
1 D 6
```
其中,参数axis=1表示按列删除。可以看到,"value_x"列已经被删除,只剩下"key"和"value_y"两列。
阅读全文