py合并两个excel重复项openpyxl
时间: 2023-08-08 11:01:27 浏览: 168
使用openpyxl库,可以很方便地合并两个excel文件并去掉重复项。下面是一个实现此功能的示例代码:
```python
import openpyxl
# 打开第一个excel文件
wb1 = openpyxl.load_workbook('file1.xlsx')
ws1 = wb1.active
# 打开第二个excel文件
wb2 = openpyxl.load_workbook('file2.xlsx')
ws2 = wb2.active
# 遍历第二个excel文件,将行数据逐行复制到第一个excel文件中
for row in ws2.iter_rows():
# 获取第二个excel文件每一行的数据
data = [cell.value for cell in row]
# 判断第一列数据在第一个excel文件中是否已存在
exists = False
for cell in ws1['A']:
if cell.value == data[0]:
exists = True
break
# 如果第一列数据不存在,则将整行数据添加到第一个excel文件的末尾
if not exists:
ws1.append(data)
# 保存合并后的excel文件
wb1.save('merged.xlsx')
```
以上代码首先使用`openpyxl`库分别打开了两个excel文件,并获取了它们的活动工作表。
然后,通过遍历第二个excel文件的每一行数据,判断第一列数据是否已经在第一个excel文件中存在。如果不存在,则将整行数据添加到第一个excel文件的末尾。
最后,使用`save()`方法保存合并后的excel文件。通过这个代码,我们可以将两个excel文件中所有不重复的行合并到一个新的excel文件中。
请注意,上述代码中使用了`file1.xlsx`和`file2.xlsx`作为示例文件名,请根据实际情况修改这两个文件名。
阅读全文