在excel中使用pandas,从文件中移除index中所有重复的行
时间: 2024-03-08 10:48:53 浏览: 84
利用Pandas来清除重复数据的实现方法
可以使用 Pandas 库中的 `drop_duplicates()` 方法来移除 DataFrame 中所有重复的行,方法如下:
```python
import pandas as pd
# 读取 Excel 文件
df = pd.read_excel('filename.xlsx')
# 移除 index 中所有重复的行
df = df.drop_duplicates()
# 将移除重复行后的 DataFrame 保存到 Excel 文件
df.to_excel('filename.xlsx', index=False)
```
其中,`df = df.drop_duplicates()` 表示将去重后的 DataFrame 赋值给 df 变量,`index=False` 表示保存时不将 index 列写入 Excel 文件。
阅读全文