python在excel中找出重复数据并删除
时间: 2024-03-25 15:41:54 浏览: 45
python实现查找excel里某一列重复数据并且剔除后打印的方法
5星 · 资源好评率100%
你可以使用Python中的pandas和openpyxl库来实现在Excel中找出重复数据并删除。以下是一个简单的示例代码:
```python
import pandas as pd
from openpyxl import load_workbook
# 读取Excel文件
df = pd.read_excel("your_file.xlsx")
# 找出重复行
duplicate_rows = df[df.duplicated()]
# 删除重复行
df = df.drop_duplicates()
# 将结果写回Excel文件
book = load_workbook("your_file.xlsx")
writer = pd.ExcelWriter("your_file.xlsx", engine='openpyxl')
writer.book = book
df.to_excel(writer, sheet_name='Sheet1', index=False)
writer.save()
```
该代码首先读取Excel文件并将其转换为pandas数据帧。然后使用`duplicated()`函数找出重复的行并将其保存在一个新的数据帧中。接着,使用`drop_duplicates()`函数删除重复行。最后,将结果写回原始Excel文件中。注意,需要安装pandas和openpyxl库才能运行该代码。
阅读全文