词激活力模型在短文本查询扩展中的应用

需积分: 0 0 下载量 41 浏览量 更新于2024-09-07 收藏 311KB PDF 举报
"短文本查询扩展中扩展词间的关联性挖掘,刘悦,徐蔚然,本文针对经典查询扩展算法展开深入调研,分析了现阶段查询扩展方法所存在的缺陷。提出了一种基于词激活力模型的扩展词间关联性挖掘算法。利用词激活力模型中词间亲密度,计算扩展词间的关联性,得到扩展词对,并利用扩展词对进行查询重构。实验表明,这种方法能有效减少信息偏移,提升检索系统性能。" 在信息检索领域,查询扩展是一种提高搜索精度的重要技术。传统的查询扩展算法常常简单地增加与原始查询相关的词汇,但这种方法可能会导致信息偏移,即引入的扩展词可能与用户的真实意图不完全匹配,反而降低检索效果。刘悦和徐蔚然的研究针对这一问题进行了深入探讨。 他们提出的词激活力模型(Word Activation Forces model,WAF)旨在更好地捕捉扩展词之间的关联性。词激活力模型基于词语在语义网络中的相互作用,通过量化词与词之间的“亲密度”来评估它们的相关性。这种模型考虑了词汇的上下文信息和语义距离,使得扩展的词汇更有可能与原始查询主题保持一致。 在实际应用中,算法首先通过计算词激活力模型中的亲密度来确定扩展词对,这些词对被认为具有较高的相关性。然后,这些扩展词对被用于重构查询,以形成新的、更精确的检索表达式。实验结果显示,这种方法能够显著减少由于扩展词引入的信息偏移,同时提高了信息检索系统的整体性能和用户满意度。 此外,该研究还指出,词激活力模型对于复杂和多义的短文本查询特别有用,因为这些查询往往需要更精细的语义理解和扩展策略。通过使用这样的模型,搜索引擎可以更准确地理解用户的查询意图,并返回更相关的结果,从而改善用户体验。 关键词:信息检索,查询扩展,扩展词对,词激活力模型,查询重构。这些关键词反映了研究的核心内容,强调了在信息检索系统中,对查询扩展方法的改进以及关联性挖掘的重要性,特别是对于短文本查询场景。通过词激活力模型,研究人员提供了新的解决方案,以解决信息检索领域的关键挑战。