python表连接,去除重复列
时间: 2023-10-20 10:09:36 浏览: 131
python 去掉重复行
5星 · 资源好评率100%
在Python中进行表连接和去除重复列可以使用pandas库。
首先,假设有两个表table1和table2,它们都有一个共同的列key,我们想要根据这个列将它们连接起来:
```python
import pandas as pd
# 创建两个表
table1 = pd.DataFrame({'key': ['A', 'B', 'C', 'D'],
'value1': [1, 2, 3, 4]})
table2 = pd.DataFrame({'key': ['C', 'D', 'E', 'F'],
'value2': [5, 6, 7, 8]})
# 进行表连接
result = pd.merge(table1, table2, on='key')
print(result)
```
输出结果:
```
key value1 value2
0 C 3 5
1 D 4 6
```
这里我们使用了merge函数,指定了连接的列key,最终得到了一个新的表result。
接下来,如果我们想要去除连接后重复的列key,可以使用drop函数:
```python
# 去除重复列
result = result.drop(columns=['key'])
print(result)
```
输出结果:
```
value1 value2
0 3 5
1 4 6
```
这里我们使用了drop函数,指定了要删除的列key,最终得到了我们想要的结果。
阅读全文