见图6。意见总结过程[30]。
分析总结系统,只是图9中的图形,其中他们提出了S.E.R
(社会事件雷达)技术。在2006年,[35]在他们的意见跟
踪系统中提出了基于图形的摘要和时间序列,该系统给出
了来自众多数据源的意见趋势。图10是他们系统中的样本
图,其中包含台湾总统选举的真实数据。Ku等人使用了
从TREC
13
语料库(文本检索会议)、NTCIR
14
语料库和来
自网络博客的文章中收集的数据集。他们建议将来也考虑
意见持有者。还有更多的工作主要集中在统计数据上,例
如[10]提出了一个意见汇总和可视化系统(OSVS),以
图形结构呈现提取的信息组件,鼓励客户快速了解产品功
能以及客户OSVS使用Google Chart API生成条形图和饼
图。图11示出了OSVS的主屏幕。同年,[36]提出了一种
方法学,该方法考虑了主题建模和主题短语挖掘,用于评
论分析和可视化。他们在评论中提取并总结了主题,如
13
http://trec.nist.gov。
14
http://research.nii.ac.jp/ntcir/index-en.html。
图或云。作为示例,图12中示出了来自voyant-tool.org具
有真实评论的样本输出。ram-amonjisoa等人建议进一步评
估必读评论,并使用更多的标准,如时间或语义关系。
在2014年,[37]提出了一种计算关于学生的合作意见值
的算法,他们的总结过程是通过平均情感得分来完成的。
他们根据从考虑学生执行力的教育工作者的评论中提取的
意见提出了一项案例研究图13展示了由他们的框架创建的
协作意见得分的示例。
我们可以得出结论,基于可视化的摘要是非常有用
的,并具有许多优点,如视觉吸引力,数据的快速分析,
易于阅读,数据的简洁表示。它也可以与其他类别的摘要
结合使用。
5.2.
抽象文本摘要
与只使用原始措辞中的完整句子的提取摘要不同,抽
象摘要包含了重新表述步骤并使用新术语[38]。由于文本
生成的困难,抽象摘要不是一种常见的策略[18]。摘要的
语言质量到目前为止还不尽如人意[39]。在这种类型的摘
要中有许多技术;这些技术包括基于模板,基于图形,基
于语义,数据驱动,机器学习和神经网络。
作为一个例子,对于基于模板的方法,[17]提出了一种
用于语音行为引导的摘要的技术,通过将语音行为识别处
理为利用支持向量机SVM的多类分类问题,
分类.他们利用言语行为从交际的角度抓住了推文的基本
依据,从而产生了摘要。如图14所示,他们将每条推文与
五种言语行为类型(陈述、问题、建议、评论或其他)相
关联,并生成概要,将提取的语言材料合并到基于言语行
为的句子模板中。图15显示了他们的一个样本模板。[40]
同样,当他们提出一种言语行为引导的摘要方法时,也遵
循了同样的方法。他们利用朴素贝叶斯分类器的Bagging
Enseminar方法;他们识别推文中的言语行为,从推文中分
离出关键词和短语,对它们进行排名并将其嵌入到特定的
摘要模板中。他们提出的系统架构在图16中示出,该系统
架构具有内容规划器(Content Planner)和语言生成器
(Linguistic Generator),内容规划器用于选择要并入摘
要中的信息,语言生成器用于挑选正确的词来表达该信
息。
对于基于图的方法[41],研究了一种通过压缩来
以及基于词图从句子中合并信息。他们的技术最初是基于
提取摘要,以帮助确定哪些新句子是