python查找csv文件重复记录并删除
时间: 2024-05-13 10:16:52 浏览: 121
Python csv文件记录流程代码解析
可以使用pandas库来完成这个任务。以下是一个简单的示例代码:
```python
import pandas as pd
# 读取csv文件
df = pd.read_csv('file.csv')
# 查找重复记录
duplicate_rows = df[df.duplicated()]
# 删除重复记录
df = df.drop_duplicates()
# 将结果保存到文件
df.to_csv('file.csv', index=False)
```
在这个示例中,我们使用pandas的`read_csv`函数来读取csv文件,并使用`duplicated`函数来查找重复记录。我们使用`drop_duplicates`函数来删除重复记录,最后将结果保存到同一个文件中。
需要注意的是,如果csv文件包含大量数据,这种方法可能会很慢。如果文件过大,可以考虑使用其他方法,例如使用数据库来存储和管理数据。
阅读全文