基于完全加权关联规则的查询扩展算法研究

需积分: 10 0 下载量 128 浏览量 更新于2024-09-08 1 收藏 169KB PDF 举报
"这篇论文研究了完全加权关联规则挖掘技术在信息检索领域的应用,特别是在查询扩展中的作用。文中提出了一种面向查询扩展的完全加权词间关联规则挖掘算法,该算法通过采用多种剪枝策略提高了挖掘效率。此外,论文还引入了一个新的查询扩展模型和扩展词权重计算方法,旨在使扩展词的选取更为合理。在此基础上,作者设计了一种基于局部反馈的查询扩展算法,该算法能从用户反馈的文档中挖掘出与原始查询相关的完全加权关联规则,构建规则库,并从中提取扩展词来优化查询。实验结果显示,这种查询扩展算法显著提升了检索性能,尤其是在保持相同查全率的情况下,其平均查准率有明显提升。" 这篇论文的核心知识点包括: 1. **完全加权关联规则挖掘**:这是一种数据挖掘技术,通过对所有项都赋予权重来更准确地发现项集之间的关联规则。在本研究中,它被用于挖掘词与词之间的关联性,以辅助查询扩展。 2. **查询扩展模型**:论文提出了一种新的模型,这个模型不仅考虑原始查询词,还结合了扩展词的权重,以更全面地理解用户的检索意图。 3. **扩展词权重计算**:通过新的计算方法,可以更准确地评估每个可能的扩展词对查询相关性的贡献,从而选择出对提高检索效果最有帮助的词。 4. **局部反馈**:利用用户的反馈信息(如点击的文档)来调整和优化查询,这是一种有效的交互式检索策略。在本文中,局部反馈用于指导关联规则的挖掘和查询的改进。 5. **剪枝策略**:在完全加权关联规则挖掘过程中,应用多种剪枝策略可以减少不必要的计算,提高挖掘效率,同时保持规则的质量。 6. **查询扩展算法**:论文提出的新算法利用完全加权关联规则挖掘的结果,从用户反馈中提取相关规则,生成扩展词,进而优化原始查询,提高检索性能。 7. **实验验证**:通过实验对比,证明了提出的查询扩展算法在查准率上有显著提升,显示了其在信息检索领域的有效性和优势。 这篇论文是国家自然科学基金资助项目的一部分,由黄名选、严小卫和张师超等人共同完成,他们在数据挖掘和信息检索领域有着深入的研究。