openpyxl删除重复项
时间: 2023-06-15 18:03:51 浏览: 413
你可以使用openpyxl中的工具来删除重复项。具体步骤如下:
1. 导入openpyxl模块和pandas模块:
```python
import openpyxl
import pandas as pd
```
2. 读取Excel文件并转换为pandas中的DataFrame格式:
```python
wb = openpyxl.load_workbook('example.xlsx')
ws = wb.active
data = ws.values
df = pd.DataFrame(data)
```
3. 使用pandas的drop_duplicate()方法删除重复项:
```python
df.drop_duplicates(inplace=True)
```
4. 将处理后的数据写入Excel文件:
```python
writer = pd.ExcelWriter('example.xlsx', engine='openpyxl')
df.to_excel(writer, index=False)
writer.save()
```
完整代码如下:
```python
import openpyxl
import pandas as pd
wb = openpyxl.load_workbook('example.xlsx')
ws = wb.active
data = ws.values
df = pd.DataFrame(data)
df.drop_duplicates(inplace=True)
writer = pd.ExcelWriter('example.xlsx', engine='openpyxl')
df.to_excel(writer, index=False)
writer.save()
```
其中,example.xlsx是你要处理的Excel文件名。执行完上述代码后,将会生成一个去重后的新文件example.xlsx。
阅读全文