提升文档检索效率:基于本体的查询扩展与语义匹配优化

需积分: 9 0 下载量 145 浏览量 更新于2024-09-09 收藏 627KB PDF 举报
本文主要探讨了"基于本体的文档信息检索模型优化"这一主题,由刘吉双和陈乙雄两位作者在重庆大学计算机学院的研究背景下完成。他们针对传统的文档检索模型中存在的两个关键问题进行了深入研究:一是查询关键词必须与文档索引关键词完全匹配的限制,这可能导致部分相关信息的遗漏;二是无法检索到包含查询关键词同义关系或包含关系的文档,这在处理一词多义情况时尤为突出。 为解决这些问题,研究者提出了两个主要的改进策略。首先,在查询阶段,他们引入了本体的概念,特别是那些与查询输入语句领域相关的本体。这种方法通过查询扩展技术,允许系统根据本体中的上下文信息扩展查询关键词,从而扩大检索范围,提高检索的全面性。这样,即使查询关键词没有完全匹配索引,也能找到相关文档。 其次,针对同义关系和包含关系的问题,他们利用特定领域的本体构建了一个改进的向量空间模型来进行文档相似度匹配。这种模型能够捕捉词语的语义关联,使得含有同义词或包含关系的文档也能被正确地识别并纳入检索结果,显著提升了检索的精确性和召回率。 实验结果显示,采用改进的基于本体的文档信息检索模型,文档的检索性能得到了显著提升,尤其是在处理多义词查询时,召回率有了明显的提高。这表明该模型不仅解决了传统检索方法的局限,还提高了用户在实际信息搜索中的体验和效率。 本研究的核心贡献在于通过结合本体理论和查询扩展技术,以及改进的语义相似性计算方法,优化了文档信息检索模型,使得信息检索更加智能和精确,对于提升现代信息技术系统的搜索性能具有重要的理论价值和实际应用价值。