云计算环境下的隐私保护:密文模糊检索方案

需积分: 9 0 下载量 142 浏览量 更新于2024-08-13 收藏 450KB PDF 举报
"云存储中支持词频和用户喜好的密文模糊检索 (2015年)" 本文主要探讨了在云存储环境下如何实现一种兼顾数据隐私保护和用户搜索体验的多关键词模糊搜索方案。该方案的核心是将词频信息和用户喜好融入到加密数据的检索过程中,以提供更精准的搜索结果,同时确保数据的安全性。 首先,文章提到了布隆过滤器(Bloom Filter)的应用。这是一种空间效率高的概率数据结构,用于判断一个元素是否可能在一个集合中。在文件索引的构建阶段,布隆过滤器被用来存储文件中的词频信息。通过这种方式,即使数据被加密,也能在一定程度上保留词汇出现的频率信息,这对于调整搜索结果的排序和相关性至关重要。 其次,该方案在查询向量的生成过程中考虑了用户喜好。这意味着用户可以为每个搜索关键词设置权重,这有助于定制化搜索结果,优先展示用户更感兴趣的文件。当用户输入可能存在误差的关键词时,局部敏感哈希函数(Locality Sensitive Hashing, LSH)被用来实现关键词的模糊匹配。LSH是一种能快速找出相似数据的技术,即便关键词有误拼或轻微变化,也能找到相关度较高的文件。 安全性方面,该方案强调在已知密文模型下是安全的。这意味着即使云存储服务器拥有密文,也无法获取用户的查询关键词和相关陷门信息,从而有效地保护了用户隐私。此外,方案的实施还考虑了云存储环境的特性,如数据的分布式存储、大规模数据处理和高效检索等。 该研究提出的方案在云存储中实现了对加密数据的模糊检索,结合了词频统计和用户喜好,提高了搜索精度,同时也保证了数据的安全性。这一方法对于云存储服务提供商和依赖云存储的用户来说,都是一种有价值的隐私保护技术,可以提升用户体验并增强数据安全性。