基于完全加权关联规则的查询扩展算法研究
需积分: 10 128 浏览量
更新于2024-09-08
1
收藏 169KB PDF 举报
"这篇论文研究了完全加权关联规则挖掘技术在信息检索领域的应用,特别是在查询扩展中的作用。文中提出了一种面向查询扩展的完全加权词间关联规则挖掘算法,该算法通过采用多种剪枝策略提高了挖掘效率。此外,论文还引入了一个新的查询扩展模型和扩展词权重计算方法,旨在使扩展词的选取更为合理。在此基础上,作者设计了一种基于局部反馈的查询扩展算法,该算法能从用户反馈的文档中挖掘出与原始查询相关的完全加权关联规则,构建规则库,并从中提取扩展词来优化查询。实验结果显示,这种查询扩展算法显著提升了检索性能,尤其是在保持相同查全率的情况下,其平均查准率有明显提升。"
这篇论文的核心知识点包括:
1. **完全加权关联规则挖掘**:这是一种数据挖掘技术,通过对所有项都赋予权重来更准确地发现项集之间的关联规则。在本研究中,它被用于挖掘词与词之间的关联性,以辅助查询扩展。
2. **查询扩展模型**:论文提出了一种新的模型,这个模型不仅考虑原始查询词,还结合了扩展词的权重,以更全面地理解用户的检索意图。
3. **扩展词权重计算**:通过新的计算方法,可以更准确地评估每个可能的扩展词对查询相关性的贡献,从而选择出对提高检索效果最有帮助的词。
4. **局部反馈**:利用用户的反馈信息(如点击的文档)来调整和优化查询,这是一种有效的交互式检索策略。在本文中,局部反馈用于指导关联规则的挖掘和查询的改进。
5. **剪枝策略**:在完全加权关联规则挖掘过程中,应用多种剪枝策略可以减少不必要的计算,提高挖掘效率,同时保持规则的质量。
6. **查询扩展算法**:论文提出的新算法利用完全加权关联规则挖掘的结果,从用户反馈中提取相关规则,生成扩展词,进而优化原始查询,提高检索性能。
7. **实验验证**:通过实验对比,证明了提出的查询扩展算法在查准率上有显著提升,显示了其在信息检索领域的有效性和优势。
这篇论文是国家自然科学基金资助项目的一部分,由黄名选、严小卫和张师超等人共同完成,他们在数据挖掘和信息检索领域有着深入的研究。
点击了解资源详情
点击了解资源详情
点击了解资源详情
2019-09-07 上传
2019-07-22 上传
2022-04-29 上传
2022-06-13 上传
2021-09-25 上传
点击了解资源详情
weixin_39840387
- 粉丝: 790
- 资源: 3万+
最新资源
- 深入浅出:自定义 Grunt 任务的实践指南
- 网络物理突变工具的多点路径规划实现与分析
- multifeed: 实现多作者间的超核心共享与同步技术
- C++商品交易系统实习项目详细要求
- macOS系统Python模块whl包安装教程
- 掌握fullstackJS:构建React框架与快速开发应用
- React-Purify: 实现React组件纯净方法的工具介绍
- deck.js:构建现代HTML演示的JavaScript库
- nunn:现代C++17实现的机器学习库开源项目
- Python安装包 Acquisition-4.12-cp35-cp35m-win_amd64.whl.zip 使用说明
- Amaranthus-tuberculatus基因组分析脚本集
- Ubuntu 12.04下Realtek RTL8821AE驱动的向后移植指南
- 掌握Jest环境下的最新jsdom功能
- CAGI Toolkit:开源Asterisk PBX的AGI应用开发
- MyDropDemo: 体验QGraphicsView的拖放功能
- 远程FPGA平台上的Quartus II17.1 LCD色块闪烁现象解析