中文密文数据库的正则索引查询优化与算法研究

需积分: 5 1 下载量 68 浏览量 更新于2024-08-11 收藏 586KB PDF 举报
本文档深入探讨了中文密文数据库正则查询的研究与实现,发表于2011年的重庆邮电大学学报自然科学版。研究背景是为了解决中文密文数据库查询的灵活性、便捷性和高效性问题,作者设计了一种创新的密文索引结构。这个索引结构的独特之处在于,它不仅记录了汉字在每个记录中的存在位置,还记录了汉字在属性值中的具体位置,从而支持对中文文本的正则表达式查询。 作者提出的正则查询处理算法巧妙地利用了索引中的汉字位置信息,能够有效地筛选出符合特定模式或条件的记录。通过精心设计的算法,实现了在加密状态下对中文数据库的高效搜索,这对于保护用户隐私的同时仍能进行灵活的数据检索具有重要意义。 实验证明,这种新型索引结构和算法能够在保持数据安全性的前提下,显著提升中文密文数据库的正则查询性能,这对于大量中文文本数据的存储和分析具有很高的实用价值。研究结果包括了一系列优化的查询策略,如子串匹配、模式匹配等,使得复杂查询操作得以快速执行。 关键词方面,文中提到了正则表达式、正则查询、位置索引和子串匹配等关键概念,这些都是理解论文核心贡献的重要术语。该论文可能被归类在计算机科学的数据库管理和信息安全领域,特别是密码学和数据挖掘子领域。 这篇论文不仅提供了理论框架,还展示了实际应用中的可行性,对于推进中文信息处理技术,特别是在隐私保护环境下,具有重要的学术和实践意义。对于那些从事数据库管理、信息安全或自然语言处理工作的研究人员来说,这是一篇值得深入研究的文献。