首页python excel查重

python excel查重

时间: 2023-09-30 20:09:32 浏览: 187

用python对excel查重

最近媳妇工作上遇到一个重复性劳动，excel表格查重，重复的标记起来，问我能不能写个程序让它自动查重标记必须安排第一次正儿八经写python，边上网查资料，边写终于成功了在此记录一下首先安装xlwings库 pip install xlwings 写代码 import xlwings as xw # 输入表名 title = input() # 指定不显示地打开Excel，读取Excel文件 app = xw.App(visible=False, add_book=False) wb = app.books.open(title) # 打开Excel文件 sheet = wb.s

在Python中，你可以使用pandas库来查找Excel文件中的重复数据。首先，你需要安装pandas库，可以使用以下命令进行安装： ```python pip install pandas ``` 接下来，你可以使用以下代码来查找Excel文件中的重复数据： ```python import pandas as pd # 读取Excel文件 df = pd.read_excel('your_file.xlsx') # 查找重复数据 duplicate_rows = df[df.duplicated()] # 打印重复数据 print(duplicate_rows) ``` 请将"your_file.xlsx"替换为你要查找重复数据的Excel文件的路径。以上代码将打印出Excel文件中的重复数据行。如果你想删除重复数据，可以使用以下代码： ```python import pandas as pd # 读取Excel文件 df = pd.read_excel('your_file.xlsx') # 删除重复数据 df.drop_duplicates(inplace=True) # 将结果保存到新的Excel文件 df.to_excel('filtered_file.xlsx', index=False) ``` 以上代码将删除Excel文件中的重复数据，并将结果保存到名为"filtered_file.xlsx"的新Excel文件中。

阅读全文