用python对一个奥运excel表进行分析,检测是否有重复⾏,并删除重复⾏
时间: 2024-02-23 08:59:07 浏览: 17
好的,可以使用Python中的pandas库读取Excel文件,然后使用drop_duplicates()方法删除重复行。
以下是一个示例代码:
```python
import pandas as pd
# 读取Excel文件,并选取需要的列
df = pd.read_excel("olympic_data.xlsx", usecols=["Year", "City", "Sport", "Discipline", "Athlete", "Country", "Gender", "Medal"])
# 删除重复行
df.drop_duplicates(inplace=True)
# 将结果写入新的Excel文件
df.to_excel("olympic_data_without_duplicates.xlsx", index=False)
```
这个示例代码会读取Excel文件"olympic_data.xlsx",并选取"Year", "City", "Sport", "Discipline", "Athlete", "Country", "Gender", "Medal"这些列。然后,它会删除重复行,并将结果写入一个新的Excel文件"olympic_data_without_duplicates.xlsx"中。