用python Thinker 写一个多线程编程文本备份文本查重的程序

本程序使用Python的多线程技术，实现文本备份和查重的功能。首先，需要定义一个函数用于备份文本： ```python import os import shutil def backup_file(src_file, dest_folder): """ 备份文件 :param src_file: 原文件的路径 :param dest_folder: 备份文件夹的路径 """ if not os.path.exists(src_file): print(f"{src_file} 不存在！") return if not os.path.exists(dest_folder): os.makedirs(dest_folder) file_name = os.path.basename(src_file) dest_file = os.path.join(dest_folder, file_name) shutil.copy(src_file, dest_file) print(f"{src_file} 备份成功！") ``` 该函数接受两个参数：原文件的路径和备份文件夹的路径。函数首先判断原文件是否存在，如果不存在则提示用户原文件不存在；如果备份文件夹不存在则创建该文件夹。然后，函数将原文件复制到备份文件夹中，并输出备份成功的提示信息。接下来，我们需要实现文本查重功能。我们可以使用哈希算法实现文本的快速查重。具体步骤如下： 1. 读取文本内容； 2. 将文本内容转换成哈希值； 3. 判断哈希值是否在已有的哈希表中，如果存在，则表示文本已经存在，否则，将哈希值添加到哈希表中。下面是具体的代码实现： ```python import hashlib def duplicate_check(file_path): """ 文本查重 :param file_path: 文件路径 """ if not os.path.exists(file_path): print(f"{file_path} 不存在！") return hash_dict = {} with open(file_path, "r", encoding="utf-8") as f: for line in f: line = line.strip() md5_value = hashlib.md5(line.encode()).hexdigest() if md5_value in hash_dict: print(f"发现重复文本：{line}") else: hash_dict[md5_value] = line ``` 该函数接受一个文件路径作为参数，首先判断文件是否存在，如果不存在则提示用户文件不存在。然后，遍历文本的每一行，将每一行的内容转换成哈希值，并与已存在的哈希表进行比较，如果已存在，则表示当前文本重复，否则，将哈希值添加到哈希表中。最后，我们可以使用多线程来同时进行文本备份和查重的操作。下面是具体的代码实现： ```python from threading import Thread def backup_and_check(file_path, dest_folder): """ 备份和查重 :param file_path: 文件路径 :param dest_folder: 备份文件夹路径 """ t1 = Thread(target=backup_file, args=(file_path, dest_folder)) t2 = Thread(target=duplicate_check, args=(file_path,)) t1.start() t2.start() t1.join() t2.join() print("任务完成！") ``` 该函数接受两个参数：文件路径和备份文件夹的路径。函数首先创建两个线程，一个线程用于备份文件，另一个线程用于查重。然后，启动两个线程，并使用join()方法等待两个线程完成工作，最后输出任务完成的提示信息。以上就是我们使用Python进行多线程编程实现文本备份和查重功能的实现方法。

阅读全文

用python Thinker 写一个多线程编程文本备份文本查重的程序

相关推荐

Python Thinker实现多页面无干扰切换示例

Python Thinker框架打造多功能个人记账本

Python用thinker开发简单俄罗斯方块游戏及设计文档

用python thinker 写一个文本查重代码

用python thinker写一个程序的基本框架有哪些

用Python thinker写一个文件名分类程序，将文件名带PNS关键字和BG关键字的文件分开

python thinker写一个多行表格勾选的界面

python thinker

python thinker 输入框

用python写一个thinker的窗口

showcase:pythonthinker展示柜

python thinker label pake

python thinker 管理系统

python thinker 窗口切换

用python的thinker做一个学生管理系统

Python Thinker 勾选功能演示

用Python的thinker编写程序包括一个标签、一个文本框和一个按钮，当用户单击按钮时，程序把文本框中的内容复制到标签中

python thinker 监听窗口位置移动事件

PythonThinker展示柜：创新的代码展示平台

Python标准库详解：核心模块与更多模块

大家在看

先栅极还是后栅极 业界争论高K技术

应用手册 - SoftMove.pdf

LQR与PD控制在柔性机械臂中的对比研究

丹麦电力电价预测 预测未来24小时的电价 pytorch + lstm + 历史特征和价格 + 时间序列

测量变频损耗L的方框图如图-所示。-微波电路实验讲义

最新推荐

Python实现定时自动关闭的tkinter窗口方法

VB图像处理工具设计(论文+源代码)(2024uq).7z

【未发表】基于混沌博弈优化算法CGO优化鲁棒极限学习机RELM实现负荷数据回归预测算法研究附Matlab代码.rar

droop（非线性负载），基于T型三电平逆变器的非线性负载下同步发电机控制，中点电位平衡控制，电压电流双闭环控制，基波提取算法 1.droop，非线性负载 2.电压电流双闭环，基波提取算法 3.提供

【未发表】基于樽海鞘优化算法SSA优化集成学习结合鲁棒极限学习机RELM-Adaboost实现负荷数据回归预测算法研究附Matlab代码.rar

S7-PDIAG工具使用教程及技术资料下载指南

管理建模和仿真的文件

CC-LINK远程IO模块AJ65SBTB1现场应用指南：常见问题快速解决

python 画一个进度条

Nginx 1.19.0版本Windows服务器部署指南

先栅极还是后栅极业界争论高K技术

丹麦电力电价预测预测未来24小时的电价 pytorch + lstm + 历史特征和价格 + 时间序列