基于同义图的词语语义相似度计算新模型

0 下载量 133 浏览量 更新于2024-08-26 收藏 1.17MB PDF 举报
本文档探讨的是"词语义相似度度量的同义图模型",发表在《中国电子学报》2015年1月第24卷第1期。该研究关注的是一个关键且广泛应用的问题,即词汇语义相似度测量,这对于知识图谱映射、计算语言学以及人工智能等领域都具有重要意义。传统的方法在计算词语相似度时,往往忽视了概念出现频率和词汇的多重含义这两个重要因素。 作者们提出了一个新的方法,即基于"同义图模型"来改进这个问题。首先,他们构建了一个同义图,这是一种图形结构,其中节点代表词汇,边则表示它们之间的语义关系,如上下位关系(hyponymy)。通过这种方式,他们能够捕捉到词义的层次性和关联性。 对于两个待比较的词语,研究人员首先检索它们相关的概念,然后构建出这些概念间的最低共同祖先矩阵(lowest common ancestor matrix)和距离矩阵,这两个矩阵分别反映了概念间的亲缘关系和路径长度。接着,他们结合两种类型的相似度计算:一种是基于距离的相似度,它衡量了概念间路径的短距离,另一种是基于信息的相似度,它考虑了信息传递和共享的程度。 最终,通过整合这两种相似度,论文提出了一种综合的词语语义相似度度量方法。这种方法的主要创新之处在于它不仅考虑了词义的直接关联,还考虑了词义在更大概念框架下的相对重要性,从而更准确地反映出词语间的语义相似性。 总结来说,这篇研究论文提供了一种新颖而全面的框架,用于量化词语之间的语义相似性,这在处理自然语言处理任务时可以显著提升模型的性能。通过利用同义图的结构和信息融合策略,作者们希望能为相关领域的理论研究和实际应用带来新的突破。