加密云数据上的安全动态多关键字排名搜索新策略

0 下载量 187 浏览量 更新于2024-08-28 收藏 887KB PDF 举报
随着云计算的日益普及,越来越多的数据所有者倾向于将他们的数据存储在云端服务器,以获得便利性和成本效益。然而,出于隐私保护的需求,敏感数据通常会在上传前进行加密,这使得传统的基于关键词的文档检索等数据利用方式变得复杂。本文提出了一种安全的动态多关键字排名搜索方案,专为加密云数据设计。 该方案的核心在于结合向量空间模型(Vector Space Model, VSM)和TF-IDF模型,在构建索引和生成查询时确保了灵活性和效率。VSM利用词频和逆文档频率(Term Frequency-Inverse Document Frequency, TF-IDF)来量化文档中的关键词重要性,而TF-IDF模型则广泛应用于信息检索,它考虑了单词在文档中的出现频率以及在整个语料库中的普遍性,以评估其相对重要性。 为了支持动态操作,如文档的添加和删除,论文构建了一种特殊的树形索引结构。这种结构有助于快速查找和更新,确保了即使在大量数据中也能实现高效的多关键字排序搜索。提出的"贪婪深度优先搜索"(Greedy Depth-first Search, GDFS)算法巧妙地利用了索引结构的优势,通过逐步扩展搜索范围来找到与多个关键词相关的文档列表,并按照相关性进行排序。 加密是这个方案的关键环节,采用了安全的k近邻(Secure k-Nearest Neighbor, s$k$NN)算法对索引和查询向量进行加密。这种方法保证了数据在加密状态下仍能进行精确的相关性评分,从而在保护用户隐私的同时,实现了高效的信息检索。 这篇研究论文解决了一个实际问题,即如何在满足数据隐私和云计算便利性的前提下,设计一个既能支持动态操作又能提供准确排名的加密云数据搜索系统。这对于云服务提供商和数据所有者来说,是一个重要的技术进步,有助于提升数据管理的实用性和安全性。