用python写一个文件内容查重的软件
时间: 2024-05-05 09:17:46 浏览: 49
以下是一个简单的Python程序,可以查找指定文件夹中所有文件的内容,并输出重复的内容。
```python
import os
def find_duplicates(folder):
# 用字典来存储每个文件的内容和文件路径
file_dict = {}
for foldername, subfolders, filenames in os.walk(folder):
for filename in filenames:
# 读取每个文件的内容
with open(os.path.join(foldername, filename), 'r') as file:
content = file.read()
# 如果内容已经存在于字典中,则说明重复
if content in file_dict:
file_dict[content].append(os.path.join(foldername, filename))
else:
file_dict[content] = [os.path.join(foldername, filename)]
# 输出重复的文件
for content, files in file_dict.items():
if len(files) > 1:
print('以下文件具有相同的内容:')
for file in files:
print(file)
print('\n')
if __name__ == '__main__':
folder = input('请输入要查找的文件夹路径:')
find_duplicates(folder)
```
使用时,运行程序并输入要查找的文件夹路径,程序会遍历整个文件夹并查找重复内容,并将重复的文件路径输出到控制台。
阅读全文