双粒度模型在中文情感特征词提取中的应用

需积分: 9 1 下载量 11 浏览量 更新于2024-08-11 收藏 928KB PDF 举报
"基于双粒度模型的中文情感特征词提取研究 (2014年)" 本文主要探讨的是如何在海量文本信息中高效且准确地提取情感特征词,以提升情感分析的性能。研究者提出了一个基于双粒度模型的方法,该方法首先通过人工筛选从情感词语集中选取种子词,并为这些种子词赋予相应的情感强度值。这个过程是关键,因为它为后续计算其他词语情感强度提供了基础。 接下来,利用这些种子词作为参照,计算情感词语集中其他词汇的情感强度,进而得到每个特征词在词语级和句子级的倾向性贡献度值。词语级关注单个词本身的情感倾向,而句子级则考虑词在句子上下文中的情感含义。这种双粒度的考虑方式旨在更全面地捕捉词在不同语境下的情感色彩。 通过将特征词在词语级和句子级的贡献度值有机融合,构建了一个双粒度模型的中文情感特征词提取框架。这种结合方式提高了提取结果的准确性,因为它不仅考虑了词语自身的感情色彩,还考虑了其在句子中的上下文影响。 实验结果显示,该方法在拥有全面的情感词典系统和准确的种子词集的情况下,能取得较高的准确率和召回率。这意味着,该模型在实际应用中,如社交媒体分析、在线评论的情感倾向判断等场景,能够有效地帮助识别和理解文本中的情感信息。 这项研究对中文情感分析领域做出了重要贡献,提出了一种新的情感特征词提取策略,它通过双粒度分析提升了情感识别的精确性,为后续的情感挖掘和文本理解提供了有力工具。此外,这种方法也强调了情感词典系统和种子词选择的重要性,为后续研究指明了方向。