收稿日期
:2016-10-25;
修回日期
:2016-12-21。
作者简介
:
邓扬
( 1991—) ,
男
,
四川成都人
,
硕士研究生
,
主要研究方向
:
信息检索
、
机器学习
;
张晨曦
( 1960—) ,
男
,
福建龙岩人
,
教授
,
博
士生导师
,
博士
,
主要研究方向
:
分布式计算
、
嵌入式系统
;
李江峰
( 1983—) ,
男
,
湖北荆州人
,
讲师
,
博士
,CCF
会员
,
主要研究方向
:
分布式计
算
、
社会网络计算
。
文章编号
: 1001-9081( 2017) 04-1065-06 DOI: 10. 11772 /j. issn. 1001-9081. 2017. 04. 1065
基于弹幕情感分析的视频片段推荐模型
邓 扬
,
张晨曦
,
李江峰
*
(
同济大学 软件学院
,
上海
201804)
( *
通信作者电子邮箱
lijf@ tongji. edu. cn)
摘 要
:
针对传统的视频情感分析方法计算效率较低且结果不易解释等问题
,
提出一种基于弹幕文本的视频片
段情感识别算法
,
并以此作为视频片段的推荐依据
。
首先对基于情感分析的视频片段推荐问题提出形式化描述
。
其
次
,
通过构建基于隐含狄利克雷分布
( LDA)
的弹幕词语分类
,
评估弹幕词语在视频片段中的多维情感向量
,
同时
,
根
据视频片段之间的情感依赖关系推荐视频的情感片段
。
所提方法的推荐准确度比基于词频
-
逆文档频率
( TF-IDF)
的
推荐算法提高了
28. 9% ,
相对于传统
LDA
模型提高了
43. 8% 。
实验结果表明所提模型可有效应用于信息繁杂的不
规则文本情感分析
。
关键词
:
视频片段推荐
;
弹幕情感
;
主题模型
;
情感分析
;
情感向量
中图分类号
:TP391. 1
文献标志码
:A
Video shot recommendation model based on emotion analysis using time -sync comments
DENG Yang, ZHANG Chenxi, LI Jiangfeng
*
( School of Software E ngineering, Tongji University, Shanghai 201804, China)
Abstract: To solve the problem that traditional video emotional analysis methods can not work effectively and the results
are not easy to explain, a video shot emotional analysis approach based on time-sync comments was proposed, as a basis for
the recommendation of video shots. First, a formal description of video shots recommendation based on emotion analysis was
studied. Then, after analyzing the classification of time sync comments based on Latent Dirichlet Allocation ( LDA) topic
model, the emotional vector of the words in time-sync comments were evaluated. Meanwhile, the emotion relationships among
the video shots were analyzed for video shots recommendation. The recommendation precision of the proposed method was
28. 9% higher than that of the method based on Term Frequency-Inverse Document Frequency ( TF-IDF) , and 43. 8% higher
than that of traditional LDA model. The experimental results show that the proposed model is effective in analyzing the complex
emotion of different kinds of text information.
Key words: video shot recommendation; time-sync comments emotion; topic modeling; emotion analysis; emotional
vector
0
引言
随着互联网的迅速普及
,
多媒体处理技术
、
网络传输
、
视
频数据处理等相关技术快速发展
,
来自不同领域的视频数据
正在以惊人的速度增长
。
例如
YouTube,
其每个月的视频播
放总次数达到了
46. 7
亿次
,
另外一个专业视频网站
Hulu
也
有超过
20
万个高质量的视频
,
其月浏览次数也维持在
9
亿
。
相对于观看一部完整的视频
,
有些时候用户更愿意观看其中
一些视频片段
。
例如一段幽默电影片段的集锦
,
或者振奋人
心的足球进球集锦
;
用户甚至希望可以根据之前看过的视频
,
搜索与之情感相似的其他视频片段
。
视频里所蕴含的情感通
常是多种情感交织的混合情感
,
所以基于情感的视频片段推
荐是一个具有挑战性的研究问题
。
近几年随着新媒体技术的发展
,
一种新类型的视频
———
弹幕视频在世界范围内变得愈来愈流行
,
即用户可以在观看
网络视频中发表自己的实时评论
,
并与其他用户产生共鸣或
者互动
。
在用户所发的弹幕中
,
往往包含着与视频当前片段
的情感相吻合的文字
,
这对展开进一步的研究起到很好的帮
助作用
。
作为一种新型的消息传递方式
,
弹幕书写与传统短
文本存在很大区别
,
主要表现在两个方面
: 1)
文本更简短随
意
。
多数评论者选择用短语
、
短句和符号来表示内心活动
。
2)
内容口语化
、
符号化
。
用户往往通过当下流行的热门语来
表达自己当前的情感
。
目前
,
有两种基于视频弹幕数据的视频分析技术可以对
该问题起到一定借鉴作用
。
其中
,
基于弹幕数据的视频片段
自动标签技术
[1 - 2]
提供了一种提取视频片段中弹幕的关键字
给这段片段打标签的技术
;
基于弹幕的视频精彩镜头的检测
方法
[3]
主要根据弹幕内容以及数量的变化曲线分析视频中
的精彩瞬间
。
这两种基于内容的分析方法往往难以刻画出视
频片段的情感趋势
,
原因有如下两点
:
其一
,
情感鲜明的视频
片段不能等同于精彩片段
,
精彩片段往往出现在弹幕评论密
集的区域
,
而这种判断模式并不适用于视频情感检测
;
其次
,
Journal of Computer Applications
计算机应用
,2017,37( 4) : 1065 - 1070,1134
ISSN 1001-9081
CODEN JYIIDU
2017-04-10
http: / /www. joca. cn