利用语义关系自动化构建中文情感词典

90 浏览量更新于2024-08-26 收藏 601KB PDF 举报

"这篇论文提出了一种基于语义关系自动构建中文情感词典的方法，主要应用于情感分析领域。研究背景是英文情感词典建设相对成熟，但中文情感词典资源匮乏。作者借鉴英文词典资源，利用HowNet的语义分析功能和SentWordNet的情感值信息，通过语义关系计算词语的情感值，生成无需人工标注的情感词典。实验结果显示，该算法生成的词典在准确率、召回率和F值上表现出色。" 本文详细讨论了在情感分析领域，如何利用语义关系自动构建中文情感词典的问题。当前，英文情感词典的构建技术已经相当成熟，拥有大量可靠资源，然而中文情感词典的建设则相对较晚，资源相对较少。为了弥补这一差距，研究者提出了一个创新性的方法，该方法主要基于HowNet——一个广泛使用的汉语语义网络。 HowNet能提供中文词汇的义原（sememes）和词语的语义分析，同时结合其DEF属性中的英文描述，可以在SentWordNet——一个英文情感词典中查找对应的义原和词语的情感极性。通过这种方式，研究人员能够利用已有的英文情感词典资源，无需额外的人工标注，就能计算出中文词语的情感值。算法的工作流程大致如下：首先，从HowNet中提取中文词语及其义原，然后分析这些词语的语义特性；其次，利用HowNet中DEF字段的英文属性，在SentWordNet中查询对应的义原和词语的情感信息；最后，依据词语与义原之间的语义关系，计算每个词语的情感值。这种方法生成的词典不仅包含了词语的语义关系，还记录了情感极性等多维度信息，丰富了词典的内容。实验部分对提出的自动构建情感词典的算法进行了验证。结果显示，与现有其他词典相比，该算法实现的词典在保持相近的准确率的同时，具有更高的召回率和F值，这意味着在情感分析任务中，使用该词典可以更全面地捕捉到情感信息，提高了分析的性能。这项研究为中文情感分析提供了一个高效且实用的工具，通过自动构建情感词典，减轻了人工标注的负担，并提升了情感分析的精度和覆盖率。未来的研究可能会进一步优化算法，提高词典的泛化能力和适应性，以应对更多复杂的情感分析场景。

书书书

第３６卷第３期国　防　科　技　大　学　学　报Ｖｏｌ．３６Ｎｏ．３

２０１４年６月ＪＯＵＲＮＡＬＯＦＮＡＴＩＯＮＡＬＵＮＩＶＥＲＳＩＴＹＯＦＤＥＦＥＮＳＥＴＥＣＨＮＯＬＯＧＹＪｕｎ．２０１４

ｄｏｉ：１０．１１８８７／ｊ．ｃｎ．２０１４０３０２０ｈｔｔｐ：／／ｊｏｕｒｎａｌ．ｎｕｄｔ．ｅｄｕ．ｃｎ

应用语义关系自动构建情感词典



谢松县，刘　博，王　挺

（国防科技大学计算机学院，湖南长沙　４１００７３）

摘　要：构建英文情感词典研究相对成熟，形成了丰富可靠的词典资源。而针对中文的研究时间短，中

文情感分析词典资源较少。借鉴现有可靠的英文词典资源，提出了基于语义关系的情感词典自动构建算法，

算法先从

ＨｏｗＮｅｔ的概念中进行中文义原和词语抽取及语义分析，再利用ＨｏｗＮｅｔ概念中ＤＥＦ中英文属性值，

在英文情感词典ＳｅｎｔＷｏｒｄＮｅｔ中进行义原和词语情感值查询，最后根据词语和义原之间的语义关系进行词语

的情感值计算。算法直接利用现有的英文情感词典，无须人工标注，生成的情感词典记录了词语的语义关

系、情感极性值等多种信息，弥补了现有词典的不足。评测实验结果表明，根据算法实现的情感词典相比其

他词典在准确率接近的情况下，召回率和Ｆ值最高，取得了较好的评测性能。

关键词：情感分析；情感词典；ＨｏｗＮｅｔ；语义关系

中图分类号：ＴＰ３９１　　文献标志码：Ａ　　文章编号：１００１－２４８６（２０１４）０３－０１１１－０５

Ａｐｐｌｙｉｎｇｓｅｍａｎｔｉｃｒｅｌａｔｉｏｎｓｔｏｃｏｎｓｔｒｕｃｔｓｅｎｔｉｍｅｎｔｌｅｘｉｃｏｎａｕｔｏｍａｔｉｃｌｌｙ

ＸＩＥＳｏｎｇｘｉａｎ，ＬＩＵＢｏ，ＷＡＮＧＴｉｎｇ

（ＣｏｌｌｅｇｅｏｆＣｏｍｐｕｔｅｒ，ＮａｔｉｏｎａｌＵｎｉｖｅｒｓｉｔｙｏｆＤｅｆｅｎｓｅＴｅｃｈｎｏｌｏｇｙ，Ｃｈａｎｇｓｈａ４１００７３，Ｃｈｉｎａ）

Ａｂｓｔｒａｃｔ：ＲｅｓｅａｒｃｈｅｓｏｎｃｏｎｓｔｒｕｃｔｉｎｇＥｎｇｌｉｓｈｓｅｎｔｉｍｅｎｔｌｅｘｉｃｏｎｉｓｒｅｌａｔｉｖｅｌｙｍａｔｕｒｅ，ａｎｄｔｈｅｒｅａｒｅａｂｕｎｄａｎｔａｎｄｒｅｌｉａｂｌｅｌｅｘｉｃａｌｒｅｓｏｕｒｃｅｓ．

ＷｈｅｒｅａｓｆｏｒＣｈｉｎｅｓｅｓｔｕｄｉｅｓ

，ｔｈｅｒｅｓｅａｒｃｈｈｉｓｔｏｒｙｉｓｓｈｏｒｔ，ａｎｄｔｈｅｒｅａｒｅｏｎｌｙａｆｅｗＣｈｉｎｅｓｅｓｅｎｔｉｍｅｎｔｌｅｘｉｃｏｎｒｅｓｏｕｒｃｅｓ．ＷｉｔｈｒｅｌｉａｂｌｅＥｎｇｌｉｓｈ

ｓｅｎｔｉｍｅｎｔｌｅｘｉｃｏｎａｓｒｅｆｅｒｅｎｃｅ，ａｎａｕｔｏｍａｔｉｃｃｏｎｓｔｒｕｃｔｉｎｇａｐｐｒｏａｃｈｗａｓｐｒｏｐｏｓｅｄ，ｂａｓｅｄｏｎｓｅｍａｎｔｉｃｒｅｌａｔｉｏｎｓｈｉｐｓ．ＦｉｒｓｔｌｙｔｈｅＣｈｉｎｅｓｅｓｅｍｅｍｅａｎｄ

ｗｏｒｄｓｗｅｒｅｅｘｔｒａｃｔｅｄｆｒｏｍｔｈｅｄｅｆｉｎａｔｉｏｎｏｆｃｏｎｃｅｐｔｓｉｎＨｏｗＮｅｔａｎｄｔｈｅｓｅｍａｎｔｉｃａｎａｌｙｓｉｓｗａｓｃａｒｒｉｅｄｏｕｔｕｐｏｎｔｈｅｍ；ｓｅｃｏｎｄｌｙｔｈｅｓｅｎｔｉｍｅｎｔａｌｖａｌｕｅ

ｏｆｅａｃｈｓｅｍｅｍｅａｎｄｗｏｒｄｗａｓｒｅｔｒｉｅｖｅｄｆｒｏｍｔｈｅＥｎｇｌｉｓｈｓｅｎｔｉｍｅｎｔｌｅｘｉｃｏｎＳｅｎｔｉＷｏｒｄＮｅｔａｃｃｏｒｄｉｎｇｔｏｔｈｅＤＥＦａｔｔｒｉｂｕｔｅｓｏｆｃｏｎｃｅｐｔｓｉｎＨｏｗＮｅｔ，

ａｎｄｔｈｅｆｉｎａｌｓｅｎｔｉｍｅｎｔａｌｖａｌｕｅｏｆｅａｃｈｗｏｒｄｗａｓｃａｌｃｕｌａｔｅｄｏｎｔｈｅｓｅｍａｎｔｉｃｒｅｌａｔｉｏｎｓｏｆｔｈｅｓｅｍｅｍｅａｎｄｗｏｒｄｓ．ＴｈｅｒｅａｄｙＥｎｇｌｉｓｈｌｅｘｉｃｏｎｗａｓｕｓｅｄ

ｗｉｔｈｏｕｔｍａｎｕａｌｌａｂｅｌｉｎｇｉｎｔｈｅｍｅｔｈｏｄ，ａｎｄｄｉｖｅｒｓｅｉｎｆｏｒｍａｔｉｏｎｏｆｗｏｒｄｓｗａｓｒｅｃｏｒｄｅｄｉｎｔｈｅｆｉｎａｌｌｅｘｉｃｏｎ，ｉｎｃｌｕｄｉｎｇｓｅｍａｎｔｉｃｒｅｌａｔｉｏｎｓａｎｄ

ｓｅｎｔｉｍｅｎｔａｌｖａｌｕｅｓ，ｗｈｉｃｈｒｅｍｅｄｙｔｈｅｌａｃｋｏｆｏｔｈｅｒｌｅｘｉｃｏｎｓ．Ｔｈｅｅｘｐｅｒｉｍｅｎｔａｌｒｅｓｕｌｔｓｓｈｏｗｔｈａｔｔｈｅｒｅｓｕｌｔｅｄｓｅｎｔｉｍｅｎｔｌｅｘｉｃｏｎｃａｎａｃｈｉｅｖｅｂｅｔｔｅｒ

ｐｅｒｆｏｒｍａｎｃｅｉｎｔｈｅｒｅｃａｌｌａｎｄＦｖａｌｕｅｍｅａｓｕｒｅｍｅｎｔｓｕｎｄｅｒｔｈｅｃｏｎｄｉｔｉｏｎｏｆａｐｐｒｏａｃｈｉｎｇｏｔｈｅｒｌｅｘｉｃｏｎｓｏｎｔｈｅｐｒｅｃｉｓｉｏｎｍｅａｓｕｒｅｍｅｎｔｓ．

Ｋｅｙｗｏｒｄｓ：ｓｅｎｔｉｍｅｎｔａｎａｌｙｓｉｓ；ｓｅｎｔｉｍｅｎｔｌｅｘｉｃｏｎ；ＨｏｗＮｅｔ；ｓｅｍａｎｔｉｃｒｅｌａｔｉｏｎ

　　随着互联网的发展，尤其是社交网络的发展，

以微博为代表的用户发布内容平台中出现了海量

含有用户主观情感色彩的文本数据。针对网络文

本的信息处理开始由获得关键词

［１］

、事件

［２］

、话

题

［３］

等事实信息，开始向情感观点等主观信息深

入，情感分析便是近年来迅速发展的信息处理技

术

［４］

。从数据中提炼出用户的主观信息对于商业

情报、舆情分析等具有重要意义。情感分析技术就

是对带有情感色彩的主观性文本进行自动推理、分

析、归纳的过程，涉及自然语言处理、机器学习、认

知科学以及社会心理学等方面的研究

［５］

。语言的

情感表达往往使用具有明确情感色彩的词汇，因此

构建带有情感色彩的词典资源是进行情感分析研

究的基础。情感分析研究在英文上发展迅速，积累

了许多情感词典资源，比如：ＧｅｎｅｒａｌＩｎｑｕｉｒｅｒ

（ＧＩ）

［６］

，ＯｐｉｎｉｏｎＦｉｎｄｅｒ（ＯＦ）

［７］

，ＡｐｐｒａｉｓａｌＬｅｘｉｃｏｎ

（ＡＬ）

［８］

，ＳｅｎｔｉＷｏｒｄＮｅｔ

［９］

以及Ｑ－ＷｏｒｄＮｅｔ

［１０］

。中

文情感分析研究起步较晚，缺乏普遍认可的可

靠的中文情感词典

［１１－１３］

。目前研究使用主要

有ＨｏｗＮｅｔ情感词典

［１４］

、ＮＴＵＳＤ情感词典

［１５］

以

及大连理工大学的情感词汇本体词库

［１６］

。这些

词典主要是以手工或半自动方式编辑而成，可

靠性和领域适应性受到限制，并且情感词以主

要褒贬二值区分，缺少情感强度值的细粒度划



收稿日期：２０１３－１０－２５

基金项目：国家自然科学基金资助项目（６１１７０１５６）

作者简介：谢松县（１９７７—），男，山东泰安人，博士研究生，Ｅｍａｉｌ：ｘｓｏｎｇｘ＠ｎｕｄｔ．ｅｄｕ．ｃｎ；

王挺（通信作者），男，教授，博士，博士生导师，

Ｅｍａｉｌ：ｔｉｎｇｅｗａｎｇ＠ｎｕｄｔ．ｅｄｕ．ｃｎ

下载后可阅读完整内容，剩余4页未读，立即下载

weixin_38597300

粉丝: 6
资源: 982

利用语义关系自动化构建中文情感词典

情感分析 情感词典 语义词典 机器学习 情感

清华大学+台湾大学(NTUSD)+知网情感词典(Hownet)

情感词典文本情感分析介绍

hownet 情感词典

nlp情感分析模型介绍

基于文本的情感分析方法研究

一个NLP研发工程师需要会的所有和代码相关的技术,尽可能详尽,尽可能多的分类列举!请认真思考后答复!至少列举100个最重要或常用技术!

用于去噪幅度dMRI的Matlab工具箱.rar

APP报毒全自动处理系统源码

智能优化算法-引力搜索优化算法（GSA）（附源码）

最新资源

情感分析情感词典语义词典机器学习情感