北京大学学报(自然科学版),第
50
卷,第
1
期,
2014
年
1
月
Acta Scientiarum Naturalium Universitatis Pekinensis,
Vo
l.
50
,
No.
1 (J
an.
2014)
doi: 1 0.13209/j.0479-8023 .2014.015
语义特征在评价对象抽取与极性判定中的作用
周红照侯明午颜彭莉张叶青侯敏
T
滕永林
中国传媒大学国家语言资源监测与研究有声媒体中心,北京
100024;
T
通信作者,
E-mail: houmin@cuc.edu.cn
摘要
提出与评价对象抽取相关的
7
类语义特征:评价触发词、评价消解词、评价对象绝缘词、后指动词、前
指动词、心理动词和指向定语的评价名词,以及与极性判定相关的
5
类语义特征:褒义性名词、贬义性名词、
语义偏移型名词、度量衡形容词和语义构式。从引人语义特征的必要性以及如何使用这些特征两方面进行阐
述。实验证明,语义特征的引人有助于提高评价对象抽取及极性判断的准确率。
关键词
语义特征;评价对象抽取;极性判定
中图分类号
TP391
Function
of
Semantic
Features
in
Opinion
Target
Extraction
and
It
s
Polarity
Identification
ZHOU
Hongzhao
,
HOU
Mingwu
,
YAN
Pengli
,
ZHANG
Yeqing
,
HOU
Min
t
,
TENG
Yonglin
Broadcast
Media
Language
Branch
, National Language Resources Monitoring
and
Research Center, Communication
University of
China
, Beijing
100024;
t Corresponding author,
E-mail:
houmin@cuc.edu.cn
Abstract
The authors bring forward seven types
of
semantic features related to opinion target extraction. They
are evaluation-triggering words
, evaluation-eliminating words, the words insulated from opinion target, the
forward-orientated verbs, the backward-orientated verbs, the verbs
of
psychological movement and the
attributive-directing verbs. Five types
of
semantic features related to polarity identification are also proposed. They
are positive nouns, negative nouns, meaning-shifting nouns, measuring
a
司
jectives
and semantic construction. The
authors explain the twelve features from aspects
of
the necessity and their usages. The result shows that the
application
of
semantic features improves the precision
of
the system.
Key
words
semantic features; opinion target extraction; polarity identification
"主观性'是指语言的这样一种特性,说话人在
说出一段话的同时表明自己对这段话的立场、态度
和感情,,
[1]
。评价句属于主观句的一种,指含有说话
者对事物褒贬、好恶、肯否等倾向性的句子,向评
价主体
(sub)
、评价对象
(obj)
、评价因子
(exp)
、成句
成分
(com)
4
个元素构成。
E(s)
=
{(sub)
,
obj
,
exp
,
(com)}
,
其中
,
E(s)
指评价句,
sub
指说话者(有些评价句是转
引他人的叙述,这时
sub
指被转引者);
obj
指评价所
针对的对象,可以是人物、事物、现象,也可以是动
作、行为、活动等;
exp
指表明评价主体倾向性的评
价因子,包括词、短语、句式
3
个范畴,
exp
在语义
上指向
obj;
cOrn
指句中除
sub
,
obj
,
exp
之外的语言
成分,其功能是保证句子合乎语法,以及向昕话者
提供其他的信息。举例如下(文中所用例句主要取
自第二届自然语言处理与中文计算会议
(NLP &ÇC20
13))
中文微博观点要素抽取评测提供的
微博语料)。
例
1
我倒觉得锤子
ROM
挺不错!
句子的评价四元素如下
sub
一-我,
obj
锤
国家语言文字工作委员会"十二五"科研规划重点项目
(ZDII25-3)
资助
收稿日期:
2013-07-05;
修回日期:
2013-09
一
18;
网络出版日期:
2013-11-11
93