OC-SVM驱动的新情感词识别与分类方法

需积分: 25 0 下载量 194 浏览量 更新于2024-09-08 收藏 984KB PDF 举报
"这篇论文‘基于OC-SVM的新情感词识别’探讨了在情感分析领域中,如何有效地识别新出现的情感词汇。研究者提出了一种基于One-Class Support Vector Machine (OC-SVM)的方法来解决这个问题。在当前的情感词库构建和极性标注研究中,新词的识别通常被忽视,而该论文则专注于此,旨在建立一个新情感词识别系统。 论文首先利用种子词扩展方法来获取可能的情感词集合,通过结合旧词典、词频信息和停用词排除,筛选出潜在的新词。实验结果显示,在特定的F值下,这种方法能够达到45.5%的正确率,显示出较好的新词筛选效果。 面对情感词与非情感词训练集的不平衡问题,研究者采用了包括词频、相邻词及其词性在内的特征,利用OC-SVM进行分类。OC-SVM是一种无监督学习模型,特别适用于小样本和异常检测任务,因此适合处理新情感词的识别。在实验中,即使在召回率26.6%的情况下,正确率仍可达到45.7%,这进一步验证了所提算法的有效性。 论文的作者包括付丽娜、肖和及姬东鸿,分别来自武汉大学计算机学院,他们的研究方向涵盖了自然语言处理、数据挖掘等多个领域。该研究得到了国家自然科学基金重点资助项目的资金支持,展示了在自然语言处理中的创新应用,尤其是对于情感分析、情感词库构建和新词发现等方面的重要贡献。 论文强调了新情感词识别在不断变化的网络语言环境中的重要性,这对于提升情感分析的准确性和实时性具有重要意义。通过这种基于OC-SVM的方法,可以更好地跟踪和理解社交媒体、评论等文本中的情感动态,从而有助于改进情感分析工具,服务于市场营销、舆情监控等多种应用场景。"