情感词网提升中文短文本分类准确率

需积分: 9 0 下载量 99 浏览量 更新于2024-09-10 收藏 1017KB PDF 举报
本文档深入探讨了"结合情感词网的中文短文本情感分类"这一研究主题。针对中文短文本常见的特征稀疏和信息量有限的问题,研究人员提出了一种新颖的方法,即通过构建情感词网来解决这些问题。情感词网是利用大规模语料库和同义词集合建立的,它不仅能够表示词语之间的直接关系,还能扩展到词与对象之间的联系。这种方法通过对短文本中的词汇赋予权重,并结合机器学习的分类算法,对文本进行情感分析,以提升分类的精确性和召回率。 在研究过程中,作者何天翔、张晖、李波、杨春明和赵旭剑共同合作,他们分别来自西南科技大学计算机科学与技术学院和中国科学技术大学计算机科学与技术学院,他们的研究领域涵盖了情感分析、文本分类、数据挖掘、知识工程等多个方面。实验结果显示,这个结合情感词网的情感分类方法在处理短文本时表现优异,有效地解决了由于文本长度较短导致的特征不充分和信息缺失问题。 关键词包括“同义词”、“情感词网”、“情感分类”和“短文本”,这些都是论文的核心概念,反映了研究的技术路径和应用背景。此外,论文还提到了中图分类号(TP391.1)、文献标志码(A)以及文章编号(1001-3695(2015)10-2905-05),这是学术期刊引用和索引的重要标识符,说明了该研究已被收录于相关的学术期刊中。 总结来说,这篇文章的主要贡献在于提供了一种有效的策略来处理中文短文本的情感分类,通过情感词网的构建和机器学习的集成,提升了情感分析的精度和效率,对于自然语言处理领域的文本理解和情感理解具有重要的实践价值。