基于负载均衡的云存储重复数据删除机制

需积分: 9 0 下载量 132 浏览量 更新于2024-09-07 收藏 779KB PDF 举报
"一种云存储系统中重复数据删除机制.pdf" 本文主要探讨了云存储系统中的重复数据删除策略,提出了一种基于负载均衡的C/S双端延迟重复数据删除方法,旨在提高存储效率并优化系统资源利用率。在现有的重复数据删除策略基础上,该方法通过以下步骤实现: 首先,数据在上传到云存储系统之前被分解成多个基于类型的数据块。这种方法有助于减少数据处理的复杂性,并允许更精确的指纹匹配。 其次,利用MD5算法提取每个数据块的指纹值,这些指纹值会与客户端本地维护的索引表进行比对。如果发现相同的指纹,客户端不再上传该数据块,而是仅发送一个指向该数据块的指针以及包含数据块指纹和数据类型的索引表。 接着,控制器在接收到客户端的请求后,会基于实时监控到的各个服务器状态选择最佳的目标存储节点。这种负载均衡策略可以防止某一台服务器因过多的数据存储而过载,确保整个系统的稳定运行。 在服务器端,根据数据类型查询不同的索引表,可以有效地缩小查找范围,进一步提高数据处理速度和存储效率。 实验结果显示,所提出的重复数据删除机制在实际应用中表现出良好的性能,能有效提高重复数据删除率,从而节省存储空间,降低成本。 该研究由江苏省高校优势学科建设工程资助项目和江苏省现代服务业研究院专项科研基金资助。作者毕朝国和徐小龙分别来自南京财经大学江苏省现代服务业研究院和南京邮电大学计算机学院,他们的主要研究方向涵盖了计算机软件、分布式计算、信息安全和物联网技术等领域。 论文还提及了相关关键词,如云存储、重复数据删除和数据副本,以及学术分类号和文章编号,这些都是论文出版和检索的重要标识。 该研究提出了一种创新的云存储解决方案,通过优化数据处理流程和负载均衡策略,提高了云存储系统在处理大量数据时的效率和存储效率,为云存储领域提供了一种有价值的参考。