python读取一个文件夹中的图片，每读取一张都要计算其均值哈希值，并与前面每图片的均值哈希值比较，如果不同的数量小于5，则认为它们相同，选其一保留

好的，我来给你讲一下如何实现这个功能。首先，你需要用Python的os模块遍历指定文件夹中的所有图片文件，并用PIL库读取图片并计算其均值哈希值。可以使用下面的代码实现： ```python import os from PIL import Image # 计算均值哈希值 def calc_avg_hash(img): # 缩放为8*8的小图 img = img.resize((8, 8), Image.ANTIALIAS).convert('L') # 计算像素平均值 avg = sum(list(img.getdata())) / 64 # 生成哈希值 hash_str = '' for i in img.getdata(): if i > avg: hash_str += '1' else: hash_str += '0' return hash_str # 遍历文件夹中的所有图片，并计算哈希值 def get_image_hash(folder): image_hash = [] for filename in os.listdir(folder): if filename.endswith('.jpg') or filename.endswith('.png'): filepath = os.path.join(folder, filename) img = Image.open(filepath) hash_str = calc_avg_hash(img) image_hash.append((filename, hash_str)) return image_hash ``` 接下来，你需要对每张图片的哈希值进行比较，如果有5张以上的图片与当前图片相似，则认为它们是相同的图片，选其中一张保留。可以使用下面的代码实现： ```python # 比较哈希值是否相似 def is_hash_similar(hash1, hash2, n): diff = 0 for i in range(len(hash1)): if hash1[i] != hash2[i]: diff += 1 return diff < n # 去除相似图片 def remove_similar_images(image_hash): result = [] for i in range(len(image_hash)): is_similar = False for j in range(i): if is_hash_similar(image_hash[i][1], image_hash[j][1], 5): is_similar = True break if not is_similar: result.append(image_hash[i]) return result ``` 最后，你可以将去重后的图片保存到指定文件夹中。可以使用下面的代码实现： ```python # 保存图片 def save_images(image_hash, folder): for filename, _ in image_hash: filepath = os.path.join(folder, filename) new_filepath = os.path.join(folder + '_new', filename) os.rename(filepath, new_filepath) # 主函数 if __name__ == '__main__': folder = 'image_folder' image_hash = get_image_hash(folder) image_hash = remove_similar_images(image_hash) save_images(image_hash, folder) ``` 这样，就完成了从文件夹中读取图片并去重的功能。希望能帮到你！

阅读全文

python读取一个文件夹中的图片，每读取一张都要计算其均值哈希值，并与前面每图片的均值哈希值比较，如果不同的数量小于5，则认为它们相同，选其一保留

相关推荐

通过算法提取图像的哈希序列，可用于两张图片相似度判断，近似查找，抄袭检测.zip

python读取和保存图片5种方法对比

用Python读取图片并对图片进行常规处理

python读取一个文件夹中的图片，每读取一张都要计算其均值哈希值，并与前面每图片的均值哈希值比较，如果哈希值差值小于5，则认为它们相同，选其一保留

pandas_python

K均值聚类算法在大数据分析中的应用与挑战

Python 数据分析中的数据结构与算法

哈希算法在图像处理中的应用

Python日志与微服务：在分散日志中保持一致性策略

Python算法与大数据：算法在大数据处理中的应用指南

【Python数据结构与股票分析】

Python编程挑战：字典与列表数据结构的高效运用与优化

【Python数据结构与人工智能】：揭秘数据结构在AI算法中的秘密

Python字符串转JSON对象与机器学习：数据转换在机器学习中的关键作用

Python与物联网：构建智能硬件控制程序的关键技术

：Python数据清洗：从Excel数据中提取价值，解锁数据洞察

Python物联网项目管理：高效工具与最佳实践的全面解析

智能教育系统构建：Python与机器学习的完美融合！

【大数据统计】：用Counter提升Python性能的5个实用技巧

【算法与模型构建】：Python生物信息学高级课程指南

大家在看

基于CDMA-TDOA的室内超声波定位系统 (2012年)

如何降低开关电源纹波噪声

西安石油大学2019-2023 计算机考研808数据结构真题卷

AWS(亚马逊)云解决方案架构师面试三面作业全英文作业PPT

python大作业基于python实现的心电检测源码+数据+详细注释.zip

最新推荐

python 密码学示例——理解哈希（Hash）算法

使用python opencv对目录下图片进行去重的方法

Python 合并多个TXT文件并统计词频的实现

python实现识别相似图片小结

Python实现通过文件路径获取文件hash值的方法

WildFly 8.x中Apache Camel结合REST和Swagger的演示

管理建模和仿真的文件

【声子晶体模拟全能指南】：20年经验技术大佬带你从入门到精通

2024-07-27怎么用python转换成农历日期

FDFS客户端Python库1.2.6版本发布