基于语义关系图的词语语义相关度计算新模型

需积分: 13 0 下载量 47 浏览量 更新于2024-08-11 收藏 3.87MB PDF 举报
"该资源是一篇研究论文,发表在2018年1月的《自动化学报》第44卷第1期,由张仰森、郑佳和李佳媛共同撰写。文章提出了一种新的基于语义关系图的词语语义相关度计算模型,利用HowNet语义词典和大规模语料库,通过提取语义依存关系,构建语义关系图,并应用图论的相关理论来计算词语的语义相关度。实验结果显示,该模型在WordSimilarity-353数据集上的斯皮尔曼等级相关系数达到0.5358,提高了中文词语语义相关度计算的准确性。" 本文主要探讨了词语的语义相关度计算,这是自然语言处理(NLP)领域中的一个重要课题。传统的研究多集中在词语的语义相似度计算,而较少关注词语的语义相关度。作者们意识到这一不足,提出了一个创新性的模型,将语义词典(如HowNet)与大规模语料库相结合,以增强对词语深层语义的理解。 首先,他们基于HowNet和语料库制定了语义关系的提取规则,从中抽取出大量的语义依存关系。HowNet是一个广泛使用的汉语语义词典,包含了丰富的词汇义项和它们之间的关系,而语料库则提供了大量真实的语言环境,帮助获取更广泛的上下文信息。 接下来,作者们以这些语义关系三元组为基本单元,构建了一个语义关系图。这种图结构能够直观地表示词语间的语义关联,有助于捕捉复杂的语义网络。 最后,利用图论的理论,他们设计了一种基于语义关系图的计算模型,通过对图中的语义关系进行处理,来评估两个词语之间的语义相关度。这种方法考虑了词语之间的直接和间接联系,增强了相关度计算的全面性和精确性。 实验部分,他们使用WordSimilarity-353数据集进行评估,这是一个常用的英文词汇相关度测试集,尽管本文主要针对中文。结果显示,提出的模型在计算词语的语义相关度上表现出色,斯皮尔曼等级相关系数达到了0.5358,这表明该模型对于中文词语的语义相关度计算有着显著的提升。 关键词包括语义相关度、语义关系图、HowNet、依存语义关系和语义相似度,这些是论文研究的核心内容。通过这篇论文,读者可以了解到如何利用语义结构和图论方法来改进词语的语义分析,为NLP领域的语义理解提供了新的研究视角。