改进的本体问答系统:基于问句相似度的83.8%~92.1%高精度转换

需积分: 9 0 下载量 30 浏览量 更新于2024-08-11 1 收藏 263KB PDF 举报
本篇文章主要探讨了"基于问句相似度的本体问答系统"的研究,发表于2010年的《广西师范大学学报:自然科学版》。作者刘汉兴、刘财兴和林旭东来自华南农业大学信息学院,他们在文中针对现有的本体问答系统中问句相似度方法的不足,提出了改进的相似度计算方法。 传统的本体问答系统面临的主要挑战是将用户的自然语言问句转换成可执行的本体查询语句,通常采用自然语言接口和问句相似度两种策略。自然语言接口方法虽然可以处理特定格式的问题,但对问句有严格的限制,且推理过程需用户参与,属于半自动过程,规则制定依赖于特定领域。另一方面,问句相似度方法通常在FAQ类型的问答系统中表现良好,但直接应用于本体问答系统时存在问题,比如通用本体的词汇相似度计算未考虑领域特定性,且对问句的多种特征(如统计、语义和结构)缺乏全面考虑。 针对这些问题,本文设计了一种新的问句相似度计算方法。首先,通过构建常问问题的查询模式集合,该方法综合考虑问句的统计特征,如词频和语法模式;语义特征,如词义相似度和概念关联;以及结构特征,如句子结构和逻辑关系。这样做的目的是为了更准确地匹配用户的自然语言问句与预定义的查询模式,以减少对用户专业知识的需求。 具体操作上,文章提出了两种选择目标问句查询模式的方式:自动选择和用户交互。自动选择利用计算出的相似度自动匹配最合适的查询模式,而用户交互则允许用户在多个候选结果中进行选择,提高了系统的适应性和用户体验。这两种方法的实验结果显示,自动选择方式的准确率为83.8%,而用户交互方式的准确率高达92.1%,表明改进的问句相似度计算方法在本体问答系统中的效果显著。 这篇文章的核心贡献在于提出了一种适用于本体问答系统的问句相似度计算方法,它能够更好地理解和处理自然语言问句,从而提高系统的性能和易用性。通过综合考虑问句的多方面特征,该方法不仅适用于专业用户,也能够简化普通用户的问题解答过程,是本体问答系统发展的一个重要进步。