python 查找EXCEL 表中D列的重复值,保留最后一个重复值所在行,删除重复值所在的其它行
时间: 2023-12-27 10:04:33 浏览: 78
自动办公-python 在Excel表格中将上下行相同内容的单元格自动合并
可以使用 Pandas 库来进行 Excel 表格的数据处理。具体的步骤如下:
1. 首先,使用 Pandas 的 read_excel 函数读取 Excel 文件:
```python
import pandas as pd
df = pd.read_excel('filename.xlsx')
```
2. 选取 D 列,并找出其中的重复值。
```python
duplicated = df[df['D'].duplicated(keep='last')]
```
这里使用了 Pandas 的 duplicated 函数,找出 D 列中的重复值。keep='last' 表示保留最后一个重复值。
3. 删除重复值所在的其它行。
```python
df.drop_duplicates(subset=['D'], keep='last', inplace=True)
```
这里使用了 Pandas 的 drop_duplicates 函数,删除了 D 列中的重复值,并保留最后一个重复值所在的行。
完整代码如下:
```python
import pandas as pd
df = pd.read_excel('filename.xlsx')
duplicated = df[df['D'].duplicated(keep='last')]
df.drop_duplicates(subset=['D'], keep='last', inplace=True)
```
其中,'filename.xlsx' 是要处理的 Excel 文件名,'D' 列是要查找重复值的列名。
阅读全文