并行加密倒排索引优化:Crypt-Lucene的性能提升与MapReduce应用

需积分: 13 0 下载量 116 浏览量 更新于2024-09-06 收藏 590KB PDF 举报
本文主要探讨了在开放系统中保护用户隐私的一种重要方法——加密数据处理,特别是针对已有的SSE-1密文检索方案在性能上的局限性。研究者束晓伟、杨庚和那海洋在《计算机工程与应用》杂志2016年第52卷第20期发表了一篇名为“并行密文倒排索引研究”的论文。 论文的核心内容是针对SSE-1在加密数据检索方面的不足,设计了一种新的加密策略和倒排索引结构,即Crypt-Lucene。Crypt-Lucene是在Lucene倒排索引基础上的创新,它旨在解决在加密状态下进行高效检索的问题。作者们对现有方案进行了改进,采用了更为安全和性能优化的加密技术,以提高数据处理效率。 此外,论文还着重提出了一个基于云计算环境的并行构建Crypt-Lucene的方法,具体采用了MapReduce框架。这种方法充分利用了分布式计算的优势,能够在多节点的Hadoop集群上并行构建索引,显著提高了索引构建的速度。实验结果显示,与SSE-1方案相比,使用Crypt-Lucene可以将索引构建时间减少约60%,显示出明显的性能提升。对于大型文档集合,利用MapReduce技术在4节点集群上并行构建8个Crypt-Lucene索引,能够进一步减少83.4%的时间,这在实际应用中具有很高的价值。 这篇论文不仅提供了理论分析,还通过实际实验验证了并行密文倒排索引Crypt-Lucene的有效性和实用性。这对于那些关心数据隐私保护和在云计算环境下处理大量加密数据的组织来说,是一项重要的技术创新。通过这项研究,作者们为加密数据检索领域的研究者和开发者提供了一个可扩展且高效的解决方案,推动了这一领域的发展。