OC-SVM驱动的新情感词识别与分类方法
需积分: 25 194 浏览量
更新于2024-09-08
收藏 984KB PDF 举报
"这篇论文‘基于OC-SVM的新情感词识别’探讨了在情感分析领域中,如何有效地识别新出现的情感词汇。研究者提出了一种基于One-Class Support Vector Machine (OC-SVM)的方法来解决这个问题。在当前的情感词库构建和极性标注研究中,新词的识别通常被忽视,而该论文则专注于此,旨在建立一个新情感词识别系统。
论文首先利用种子词扩展方法来获取可能的情感词集合,通过结合旧词典、词频信息和停用词排除,筛选出潜在的新词。实验结果显示,在特定的F值下,这种方法能够达到45.5%的正确率,显示出较好的新词筛选效果。
面对情感词与非情感词训练集的不平衡问题,研究者采用了包括词频、相邻词及其词性在内的特征,利用OC-SVM进行分类。OC-SVM是一种无监督学习模型,特别适用于小样本和异常检测任务,因此适合处理新情感词的识别。在实验中,即使在召回率26.6%的情况下,正确率仍可达到45.7%,这进一步验证了所提算法的有效性。
论文的作者包括付丽娜、肖和及姬东鸿,分别来自武汉大学计算机学院,他们的研究方向涵盖了自然语言处理、数据挖掘等多个领域。该研究得到了国家自然科学基金重点资助项目的资金支持,展示了在自然语言处理中的创新应用,尤其是对于情感分析、情感词库构建和新词发现等方面的重要贡献。
论文强调了新情感词识别在不断变化的网络语言环境中的重要性,这对于提升情感分析的准确性和实时性具有重要意义。通过这种基于OC-SVM的方法,可以更好地跟踪和理解社交媒体、评论等文本中的情感动态,从而有助于改进情感分析工具,服务于市场营销、舆情监控等多种应用场景。"
2019-09-08 上传
2019-07-22 上传
2019-08-14 上传
2019-09-12 上传
2019-09-07 上传
2019-07-22 上传
2019-07-22 上传
weixin_39841848
- 粉丝: 512
- 资源: 1万+
最新资源
- 俄罗斯RTSD数据集实现交通标志实时检测
- 易语言开发的文件批量改名工具使用Ex_Dui美化界面
- 爱心援助动态网页教程:前端开发实战指南
- 复旦微电子数字电路课件4章同步时序电路详解
- Dylan Manley的编程投资组合登录页面设计介绍
- Python实现H3K4me3与H3K27ac表观遗传标记域长度分析
- 易语言开源播放器项目:简易界面与强大的音频支持
- 介绍rxtx2.2全系统环境下的Java版本使用
- ZStack-CC2530 半开源协议栈使用与安装指南
- 易语言实现的八斗平台与淘宝评论采集软件开发
- Christiano响应式网站项目设计与技术特点
- QT图形框架中QGraphicRectItem的插入与缩放技术
- 组合逻辑电路深入解析与习题教程
- Vue+ECharts实现中国地图3D展示与交互功能
- MiSTer_MAME_SCRIPTS:自动下载MAME与HBMAME脚本指南
- 前端技术精髓:构建响应式盆栽展示网站