基于WordNet概念IC的语义相似度提升算法

需积分: 10 0 下载量 113 浏览量 更新于2024-09-05 收藏 585KB PDF 举报
本篇论文研究主要探讨了一种新的含噪语音实时迭代维纳滤波方法,应用于计算WordNet中的概念语义相似度。WordNet是一个广泛使用的英语词汇数据库,其中包含了丰富的词语关系,如is_a关系,用于表示词语之间的上下位关系。传统的基于WordNet的语义相似度算法通常依赖于特征参数,如路径长度、公共祖先深度等。 论文提出了一种创新的IC(信息内容)模型,该模型利用WordNet的内在结构,不依赖额外的语料库,仅通过对每个概念在is_a关系树中的节点数量和深度进行考虑,来确定其特征参数。与基于路径的距离或公共祖先深度的方法不同,这种模型更精确地反映了概念的语义内涵,考虑了子节点的多少和概念在整个分类树中的位置。 实验部分,作者将新提出的IC模型应用到多种现有的相似度算法中,通过对公用数据集中的概念对进行计算,并与人工判定的相似度值进行相关系数比较。结果显示,使用IC模型作为特征参数的相似度算法表现出了显著的优势,计算得出的相关系数值较高,这证明了该模型的有效性和优越性。 这篇论文不仅深化了我们对WordNet中概念语义相似度计算的理解,也提供了实践上的改进策略,有助于提升基于WordNet的自然语言处理任务,如信息检索、词义消歧和文本理解的准确性和智能性。这对于语音处理领域,尤其是在噪声环境下处理语音信号,具有重要的理论和实际价值。