第 !" 卷#第 $ 期 #
!"#$!"# %"$$ #
计 算 机 工 程
&"'()*+,-./0.++,0./
##
%&%& 年 $ 月
12,34 %&%&
!人工智能与模式识别!
文章编号" !"""#$%&' #&"&"$"$#""%S#"T ( ( ( 文 献 标 志 码 " )(((中图分类号" *+$,!
基金项目"国家自然科学基金面上项目!"'()$$%, " #
作者简介"胡均毅!'**$$" % 男 %硕士研究生%主研方向为机器学习&自然语言处理'李金龙%副 教 授 &博 士 #
收稿日期"%&'*5&!5&, # # 修 回 日 期 "%&'* 5&( 5&, # # -#./01""'&')&&%( + OO$3" '
基于情感评分的分层文本表示情感分类方法
胡均毅!李金龙
! 中国科学技术大学 计算机科学与技术学院%合肥 %$&&%) "
摘# 要" 文本中的词并非都具有相似的情感倾向和强度%较 好 地编码 上 下文并 从中提 取 关键信 息 对于情 感 分类任
务而言非常重要# 为此%提出一种基于情感评分的分层注意力网络框架%以 对 文 本情感进行有效分类# 利 用 双 向
循环神经网络编码器分别对词向量和句向量进行编码%并通过注意力机制加权求 和 以获得 文 档的最 终表示# 设 计
辅助网络对文本的词&句进行情感评分%利用该 评 分 调 整 注 意 力 权 重 分 布# 在 探 究 文 本 的 情 感 信 息 对 分 类 性 能 的
影响后%通过辅助网络进一步 促 使 模 型 关 注 情 感 色 彩 强 烈 的 信 息# 在 ! 个 常 用 情 感 分 类 数 据 集 上 的 实 验 结 果 表
明%该框架能够关注文本中的情感表达并获得较高的分类准确率#
关键词" 文本表示'情感分类'情感计算'注意力机制'循环神经网络
开放科学# 资源服务$ 标志码# ?@A<$ "
中文引用格式"胡均毅%李金龙$基于情感评分的分层文本表示情感分类方法( B) $计算机工程%%&%&%!"!$"*!"5(%%(*$
英文引用格式"FD B).70% VAB0.#"./$@+.*0'+.*+I 2#)2*0". H2J+K 40+,2,34032#*+P*,+(,+J+.*2*0". '+*4"K 6",J+.*0'+.*
3#2JJ06032*0".( B) $&"'()*+,-./0.++,0./%%&%& %!"!$ " *!" 5(% %(*$
26>B0.6>B-5/13/B08>:/@6GZ064/4;=0;/1*6RB?6A46@6>B/B08>U6B=8G
98426>B0.6>BM1/@@090;/B08>
FD B).70%VAB0.#"./
! @34""#"6&"'()*+,@30+.3+2.K M+34."#"/7%D.0I+,J0*7 "6@30+.3+2.K M+34."#"/ 7 "6&40.2%F+6+0%$&&%) %&40.2"
+ )D@B4/;B, %"*2##8",KJ0. *4+*+P*42I+J0'0#2,J+.*0'+.**+.K+.37 2.K 0.*+.J0*7%J" 0*0JI+,7 0'(",*2.*6",J+.*0'+.*
3#2JJ06032*0". *2J;J*42**4+3".*+P*0J8+##+.3"K+K 2.K *4+;+7 0.6",'2*0". 0J+P*,23*+K$M4+,+6",+%*40J(2(+,(,"("J+J2
40+,2,34032#2**+.*0". .+*8",; 6,2'+8",; H2J+K ". J+.*0'+. *+I 2#)2*0". *" 3".K)3*+66+3*0I+3#2JJ06032*0" . 6",*+P*
J+.*0'+.*$M4+H0K0,+3*0".2#,+3),,+.*.+),2#.+*8",; +.3"K+,0J)J+K *" +.3"K+*4+8",K I+3*",2.K J+.*+.3+I+3*",
,+J(+3*0I+#7 2.K *4+60.2#,+(,+J+.*2*0". "6*4+*+P*0J"H*20.+K H7 *4+8+0/4*+K J)' "62**+.*0". '+342. 0J'$?. *40J
H2J0J%*4+2)P0#02,7 .+*8",; 0JK+J0/.+K *" +I2#)2*+*4+J+.*0'+.*"68",KJ2. K J+.*+.3+J$M4++I2#)2*0". J3",+0J)J+K *"
2K9)J**4+K0J*,0H)*0". "62**+.*0". 8+0/4*$=6*+,+P(#",0. / *4+0.6#)+.3+"6J+.*0'+.*0.6",'2*0". "6*+P*". 3#2JJ06032*0".
(+,6",'2.3+%". *4+H2J0J"640+,2,34032#,+(,+J+.*2*0".%*4+'"K+#0J6),*4+,(,"'(*+K *" 6"3)J". *4+0.6",'2*0". 80*4
J*,"./ J+.*0'+.*3"#",*4,")/4 *4+2)P0#02,7 .+*8",;$-P(+,0'+.*2#,+J)#*J". 6"),3"''".#7 )J+K J+.*0'+.*3#2JJ06032*0".
K2*2J+*JJ4"8 *42**4+(,"("J+K 6,2'+8",; 32. 6"3)J". *4+J+.*0'+.*+P(,+JJ0". 0. *4+*+P*2.K "H*20. 40/4 3#2JJ06032*0".
233),237$
+ E67 F84G@, *+P*,+(,+J+.*2*0".'J+.*0'+.*3#2JJ06032*0".' J+.*0'+.*3"'()*0./' 2**+.*0". '+342.0J'' S+3),,+.*%+),2#
%+*8",;! S%%"
CHI*' & $'*"), Q9$0JJ.$'&&& 5$!%, $&&(!(%'
"(概述
文本分类作 为 自 然 语 言 处 理 ! %2*),2#V2./)2/+
T,"3+JJ0./%%VT"中的 一 项 基 础 性 工 作%被广 泛 应 用
于文本检索
(')
&文本排序
(%)
和情感分类
($)
等任务中#
文本的情感分类要求按照文本整体情 感倾向对 文档
进行分类# 其中%识 别 文 档 中 的 积 极& 消 极&中 立 情
感及其表达强度%是取得良好分类效果的关键#
文本由单词等符号信息构成%因此%在进行 情感
分类前首先 需 要 对 这 些 符 号 信 息 进 行 向 量 化 表 示#