python excel查重
时间: 2023-09-30 20:09:32 浏览: 187
用python对excel查重
在Python中,你可以使用pandas库来查找Excel文件中的重复数据。首先,你需要安装pandas库,可以使用以下命令进行安装:
```python
pip install pandas
```
接下来,你可以使用以下代码来查找Excel文件中的重复数据:
```python
import pandas as pd
# 读取Excel文件
df = pd.read_excel('your_file.xlsx')
# 查找重复数据
duplicate_rows = df[df.duplicated()]
# 打印重复数据
print(duplicate_rows)
```
请将"your_file.xlsx"替换为你要查找重复数据的Excel文件的路径。以上代码将打印出Excel文件中的重复数据行。
如果你想删除重复数据,可以使用以下代码:
```python
import pandas as pd
# 读取Excel文件
df = pd.read_excel('your_file.xlsx')
# 删除重复数据
df.drop_duplicates(inplace=True)
# 将结果保存到新的Excel文件
df.to_excel('filtered_file.xlsx', index=False)
```
以上代码将删除Excel文件中的重复数据,并将结果保存到名为"filtered_file.xlsx"的新Excel文件中。
阅读全文