读取两个excel表格,选择两个表格中列名均为doc_id的两列,逐行匹配两列数据相同的所有行写入新表格中
时间: 2024-05-14 08:15:53 浏览: 142
你可以使用Python中的pandas库来实现此功能。
首先,使用pandas中的read_excel()函数读取两个Excel表格,并将结果存储在两个pandas数据框中。假设表格1的文件名为excel1.xlsx,表格2的文件名为excel2.xlsx。
```python
import pandas as pd
# 读取两个Excel表格
df1 = pd.read_excel('excel1.xlsx')
df2 = pd.read_excel('excel2.xlsx')
```
接下来,选择两个表格中列名均为doc_id的两列。假设这两列分别为doc_id1和doc_id2。
```python
# 选择两个表格中列名均为doc_id的两列
doc_id1 = df1['doc_id']
doc_id2 = df2['doc_id']
```
然后,使用pandas中的merge()函数将两列数据相同的所有行匹配,并将结果存储在一个新的pandas数据框中。
```python
# 匹配两列数据相同的所有行
result = pd.merge(df1, df2, how='inner', on='doc_id')
```
最后,将新的数据框写入新表格中。假设新表格的文件名为new_excel.xlsx。
```python
# 将新的数据框写入新表格中
result.to_excel('new_excel.xlsx', index=False)
```
完成上述步骤之后,你就可以从新的Excel表格中查看匹配的数据了。
阅读全文