python对excel的两列数据去重
时间: 2023-11-22 19:49:58 浏览: 136
以下是使用openpyxl包对excel的两列数据进行去重的Python代码:
```python
from openpyxl import load_workbook
def remove_duplicates(file_path, sheet_name, col_num):
# 加载工作簿
wb = load_workbook(file_path)
# 选择工作表
ws = wb[sheet_name]
# 获取指定列的所有单元格
col_cells = ws.columns[col_num - 1]
# 去重并按原顺序保留唯一值
unique_values = list(dict.fromkeys([cell.value for cell in col_cells]))
# 将x统一格式化为X
unique_values = [str(value).upper().replace('X', 'X') for value in unique_values]
# 将去重后的值写回到指定列
for i, value in enumerate(unique_values):
ws.cell(row=i+1, column=col_num, value=value)
# 保存工作簿
wb.save(file_path)
# 示例:对名为data.xlsx工作簿中的Sheet1工作表的第2列进行去重
remove_duplicates('data.xlsx', 'Sheet1', 2)
```
阅读全文