import pandas as pd # 读取csv文件 df = pd.read_csv('uniform.csv',encoding='gbk',dtype=str) # 找到所有重复的行 duplicates = df[df.duplicated(keep=False)] # 根据重复行进行分组 groups = duplicates.groupby(list(duplicates.columns)) # 遍历每个分组,将重复行写入新的csv文件 for _, group in groups: group.to_csv('duplicates.csv', mode='a', header=False, index=False,encoding='gbk')为什么没有输出duplicate.csv文件到磁盘中?
时间: 2024-02-06 10:03:15 浏览: 46
解决pandas使用read_csv()读取文件遇到的问题
这段代码的逻辑是找到所有重复的行,并将它们写入一个名为'duplicate.csv'的文件中。但是,代码中使用了mode='a'参数,这表示以追加的方式打开文件,如果文件已存在,则将新的内容添加到文件末尾。因此,如果'duplicate.csv'文件已经存在,代码将不会创建一个新的文件,而是将重复行添加到现有文件的末尾。如果您想要覆盖现有文件或者创建一个新的文件,可以将mode参数改为'w'。另外,请确保代码所在的目录有写入权限。
阅读全文