opencv 利用哈希值算法大批量删除数据集中重复的图片

你可以使用哈希值算法来检测和删除数据集中的重复图片。一种常用的哈希算法是感知哈希算法（Perceptual Hashing），它可以将图片转换成一个唯一的哈希值。以下是使用OpenCV和Python进行大批量删除重复图片的基本步骤： 1. 导入所需的库： ```python import os import cv2 import imagehash from PIL import Image ``` 2. 定义一个函数来计算图片的哈希值： ```python def calculate_hash(image_path): image = Image.open(image_path) image_hash = imagehash.average_hash(image) return str(image_hash) ``` 3. 创建一个空字典来存储每个哈希值及其对应的图片路径： ```python hash_dict = {} ``` 4. 遍历数据集中的每张图片，计算其哈希值，并将哈希值及其对应的图片路径存储在字典中： ```python dataset_path = 'your_dataset_path' for root, dirs, files in os.walk(dataset_path): for file in files: image_path = os.path.join(root, file) image_hash = calculate_hash(image_path) if image_hash in hash_dict: hash_dict[image_hash].append(image_path) else: hash_dict[image_hash] = [image_path] ``` 5. 遍历字典中的每个哈希值，如果该哈希值对应的图片路径数量大于1，则删除重复图片（保留一张即可）： ```python for image_hash, image_paths in hash_dict.items(): if len(image_paths) > 1: for i in range(1, len(image_paths)): os.remove(image_paths[i]) ``` 注意：在删除图片之前，请务必备份你的数据集，以防止误删。这是一个基本的示例，你可以根据自己的需求进行相应的修改和优化。希望能对你有所帮助！

opencv 利用哈希值算法大批量删除数据集中重复的图片

相关推荐

OpenCvSharp 图像拼接 OpenCV感知哈希算法进行图片相似度对比

opencv角点检测算法接口概述及KeyPoint数据结构

opencv-图片相似度对比代码-感知哈希算法

gui和opencv实现余弦哈希算法图像相似匹配系统

opencvsharp4 感知哈希算法 相似度

opencv 图片相似 哈希 java

Python opencv模板匹配循环算法去最佳值算法

python利用opencv库基于KNN算法实现水果识别

opencv 图片去雾算法

python opencv 压缩图片算法

opencv图片二值化python

OpenCV中的行人检测算法用到了哪些数据集

opencv对图片做laplacian算法运算并展示图片

利用opencv实现图片识别

如何调用opencv的图像二值化算法 并举例

opencv读取图片像素值

如何利用opencv进行图像的亮度提取算法设计

opencv中kmeans聚类算法

python利用opencv截取图片

最新推荐

基于OpenCv的运动物体检测算法

C#中OpenCvSharp 通过特征点匹配图片的方法

Opencv基于CamShift算法实现目标跟踪

OpenCV中的cv::Mat函数将数据写入txt文件

Opencv EigenFace人脸识别算法详解

zigbee-cluster-library-specification

管理建模和仿真的文件

实现实时数据湖架构：Kafka与Hive集成

解答下列问题：S—＞S；T｜T；T—＞a 构造任意项目集规范族，构造LR（0）分析表，并分析a;a

JSBSim Reference Manual

opencvsharp4 感知哈希算法相似度

opencv 图片相似哈希 java

如何调用opencv的图像二值化算法并举例