没有合适的资源?快使用搜索试试~ 我知道了~
首页基于HowNet的中文网络评论情感倾向性深度分析
该论文《中文网络评论观点词汇语义褒贬倾向性判断 (2012年)》发表于《计算机应用》期刊,2012年第11期,着重探讨了在网络评论信息爆炸的时代背景下,自动识别用户评论观点的褒贬倾向性的重要性。作者李华储和高吴来自重庆大学计算机学院和软件学院,他们提出了一种基于HowNet的词汇语义相似度方法进行改进,以适应对评论词汇倾向性判断的需求。 论文的核心内容是基于HowNet这一语义知识库,利用词汇语义相似度作为衡量工具。HowNet是一种广泛使用的汉语词汇语义网络,它能够提供词汇之间的语义关系,有助于理解词语在不同上下文中的含义。原始方法依赖于词汇与特定基准词的相似度来判断其情感倾向,但作者注意到这种方法可能过度依赖较大的相似度值,忽视了其他潜在的信息。 为了提高准确性,论文提出了一种改进策略:当词汇与多个基准词的相似度较小时,会弱化这些较大的相似度值的影响,以防止单一指标导致判断偏差。这种策略旨在更全面地考虑词汇的多方面语义特征,减少误导性判断的可能性,从而提升倾向性判断的精度。 实验结果显示,经过改进的方法在计算观点词的词汇语义相似度时更为精细和客观,而且在实际的倾向性判断任务中,准确性有所提升。这表明,通过考虑词汇的多元性和细微差别,可以有效地增强计算机在分析网络评论情感倾向方面的性能。 关键词包括“中文信息处理”、“网络评论”、“观点”、“语义相似度”以及“语义倾向”,这些都是论文研究的重点领域,反映了作者关注的实际应用场景和理论基础。整体上,这篇论文为理解和挖掘中文网络评论的情感色彩提供了新的视角和技术手段,对于信息检索、舆情分析等领域具有实际价值。
资源详情
资源推荐
Joumal of Computer Applications
计算机应用,
2012
,
32( 11) : 3023 - 3025, 3033
ISSN 1001-9081
CODENJYIIDU
2012-11-01
http://www.joca.cn
文章编号:
1
∞
1
-9081(2012)11
-3023
-03
doi:10.
3724/SP.
J.
1087.2012.03023
中文网络评论观点词汇语义褒贬倾向性判断
李华储荷兰
1
.高吴
2
(1.重庆大学计算机学院,重庆
4
∞
ω4;
2.
重庆大学软件学院,重庆
4
∞
ω4)
(
*通信作者电子邮箱
chuhelan@
126.
com)
摘
要:。由于网络评论信息的庞大,因此通过计算机自动识别出用户评论观点的褒贬倾向性具有重要意义。以
基于
HowNet
的词汇语义相似度方法的词汇语义倾向性分析为基础,根据观点坷的褒贬特性改进词汇语义相似度计
算方法以适用于评论词汇的倾向性判断,并且考虑词汇与多个基准词相似度较小时弱化个别有价值的较大相似度,
从而提高倾向性判断的准确率。实验结果表明,改进后的方法在计算观点词词汇语义相似度时更为合理,并且判断
倾向性时准确率有一定的提高。
关键词:中文信息处理;网络评论;观点;语义相似度;语义倾向
中图分类号
:T
凹
9
1.
43
文献标志码
:A
Semantic orientation study on Chinese network comments
LI
Hua\
CHU
He-Ian
1
'
,
GAO
Min
2
(
1.
College 01 Computer Science, Chongqing University, Chongqing
40
∞
44
,
China;
2. College
01
Software Engineering, Chongqing University, Chongqing 400044, China)
Abstract:
Considering the huge amount of information in network comments, using computers
to
recognize the semantic
orientation of the comments automatically will make great significance. In this paper, by using the semantic orientation
analysis based on HowNet-based semantic similarity method, the research improved related methods to satisfy the semantic
orientation recognition of network comments. The experimental results show that the improved method is more reasonable
, and
to
some degree the accuracy rate of semantic orientation recognition has been improved.
Key
words:
Chinese information processing; network comment; viewpoint; semantic similarity; semantic orientation
0
引言
随着互联网的快速发展,越来越多的用户倾向于直接在
网络上表达自己关于各种产品或信息资源的评论。这些评论
在一定程度上体现了人们对产品或信息资源的主观态度,表
现出鲜明的褒贬性。挖掘用户的情感信息,即根据用户的评
论信息发现用户对该产品或资源的态度,对用户和产品商家
或资源发布者都具有重要意义:用户可以通过关于该产品或
资源的评论的分析来获取对产品或资源的了解,帮助自己做
出正确的选择,以选择最适合自己的产品或资源;商家或资源
发布者可以通过对用户偏好的研究来确定不同产品或资源的
优缺点,为其完善更新产品或资源提供方向。但是网络信息
资源过于庞大,阅读、分析、总结这些评论和反馈意见的工作
变得十分繁琐和耗时。因此如何快速有效获得评论的褒贬极
性以及极性强度便成为了一个难题
[1]
。
语义倾向性研究正是为解决这一问题而产生。所谓词汇
的语义倾向,即对于词汇的褒贬程度计算出一个度量值。为
了便于统计和比较,目前比较常用的做法是将度量值规定为
位于:1:
1
之间的实数。当度量值高于某阔值时,判别为褒义
倾向;反之,则判为贬义倾向
[2
-3]
本文研究的是中文网络评论中的观点词褒贬倾向性计
算,通过分析褒贬性词汇的语义描述式,提取特定义原"良"
和"芳改进词汇语义相似度计算方法;在此基础上,改进词
汇语义倾向性计算方法提高倾向性判断准确率。在改进文献
[4J
词汇相似度计算方法的同时,对文献
[2J
中基于词汇相似
度的词汇语义倾向性计算的方法进行调整,通过实验证明本
文提出的词汇相似度计算方法和词汇语义褒贬倾向计算方法
在准确率上有了一定的提高。
1
基于知网的词汇语义倾向计算
1.
1
<<知网》
《知网
HHowNet)
是一个以汉语和英语的词汇所代表的
概念为描述对象,以揭示概念与概念之间以及概念所具有的
属性之间的关系为基本内容的常识知识库。《知网》中有两
个主要的概念概念"和"义原概念"是对词汇语义的一
种描述,每一个词可以表达为几个概念。"概念"是用一种
"知识表示语言"来描述的,这种"知识表示语言"所用的"词
汇"叫作"义原义原"是用于描述一个"概念"的最小意
义单位
[5]
。义原一方面作为描述概念的最基本单位,即所有
的词都最终归结于用义原(个别用具体词)来表示(有褒贬倾
向的词也不例外)
;另一方面,义原之间又存在复杂的关系,
在《知网》中一共描述
8
种关系,其中最重要的是上下位关
系,根据义原的上下位关系,组织成一个树状义原层次体系,
这是进行语义相似度计算的基础
[6]
。
1.
2
基于《知网》的词汇语义相似度计算
文献
[4J
中基于《知网》的词汇语义相似度计算方法是
收稿日期
:2012-05-04
;修回日期
:2012-06-19
。
基金项目:国家自然科学基金资助项目
(71102065)
。
作者简介:李华(1
962
- )
,女,重庆人,副教授,博士,主要研究方向:计算机网络与通信、综合网络信息系统、现代远程教育;
储荷兰
(1
989
- )
,女,安徽安庆人,硕士研究生,主要研究方向:自然语言处理、情感分析、远程教育;
高臭(1
980
- )
,女,山东威海人,讲师,博士,
CCF
会员,主要研究方向:个性化推荐、远程教育、情感分析。
下载后可阅读完整内容,剩余3页未读,立即下载
weixin_38503483
- 粉丝: 8
- 资源: 942
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 李兴华Java基础教程:从入门到精通
- U盘与硬盘启动安装教程:从菜鸟到专家
- C++面试宝典:动态内存管理与继承解析
- C++ STL源码深度解析:专家级剖析与关键技术
- C/C++调用DOS命令实战指南
- 神经网络补偿的多传感器航迹融合技术
- GIS中的大地坐标系与椭球体解析
- 海思Hi3515 H.264编解码处理器用户手册
- Oracle基础练习题与解答
- 谷歌地球3D建筑筛选新流程详解
- CFO与CIO携手:数据管理与企业增值的战略
- Eclipse IDE基础教程:从入门到精通
- Shell脚本专家宝典:全面学习与资源指南
- Tomcat安装指南:附带JDK配置步骤
- NA3003A电子水准仪数据格式解析与转换研究
- 自动化专业英语词汇精华:必备术语集锦
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功