微博中的事件摘要机制

22 浏览量更新于2023-11-29 收藏 1.48MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

486微博中的事件摘要机制新加坡国立大学RrubaaPanchendrarajan计算机学院rrubaa@comp.nus.edu.sg许永宁新加坡国立大学新加坡国立大学新加坡国立大学可信互联网和社区中心whsu@comp.nus.edu.sg李梦莉新加坡国立大学新加坡国立大学新加坡国立大学可信互联网和社区中心leeml@comp.nus.edu.sg摘要微博已经成为人们分享信息和感受的首选交流方式，尤其是对于快速发展的事件。了解人们的情绪反应，使决策者能够制定更容易受到公众欢迎的政策，从而更好地接受，特别是在政策执行期间。然而，由于微博的短暂和嘈杂的性质，随着时间的推移发现与事件相关的话题和情绪是一个挑战。这项工作提出了一种弱监督学习方法来学习连贯的主题和相应的情绪反应，作为一个事件的展开。我们通过给出具有代表性的微博以及与话题相关的情感分布来总结事件。在多个真实事件数据集上的实验表明了该方法的有效性。关键词主题-情感学习、微博、事件总结ACM参考格式：Rrubaa Panchendrarajan，Wynne Hsu和Mong Li Lee。2021年微博中情感感知的事件摘要在2021年网络会议（WWW '21 Companion）的配套程序中，2021年4月19日至23日，斯洛文尼亚卢布尔雅那。ACM，New York，NY，USA，9页。 https://doi.org/10.1145/3442442。 34523111介绍微博平台已成为用户之间的流行沟通方式，尤其是在现实世界中发生事件时分享新闻和观点。这导致了微博事件分析的广泛研究，包括主题挖掘和事件摘要。现有的基于微博文本内容的事件总结工作大多提供了一般的事实总结[3，12，14，19，28]，而没有考虑用户的情感反应。然而，对用户的情感反应有很好的理解对政策制定者是有用的。图1显示了一个摘要示例，其中包含了用户本文在知识共享署名4.0国际（CC-BY 4.0）许可下发布。作者保留在其个人和公司网站上以适当的署名传播作品的权利WWW©2021 IW 3C 2（国际万维网大会委员会），在知识共享CC-BY 4.0许可下发布。ACM ISBN 978-1-4503-8313-4/21/04。https://doi.org/10.1145/3442442.3452311在COVID-19爆发期间使用关键词corona，coronavirus和nCov。我们观察到，在疫情爆发之初，人们的主要情绪是害怕，因为中国的新确诊病例和死亡人数增加，随后在伊朗也发现了新的病例和死亡人数。随着中国的死亡人数急剧上升，人们的主要情绪是悲伤。当纽约确诊第一例病例时，人们再次感到恐惧，这表明人们认识到COVID-19可能会成为一场大流行病。当意大利在3月16日报告了大量新冠病例时，人们大多感到惊讶，可能是因为疾病感染率很高当医疗系统被报道处于不堪重负的边缘时，他们的情绪变成了恐惧。当各国开始进入封锁状态时，人们的主要情绪是悲伤，因为人们呆在家里。当Lady Gaga宣布筹集到的资金用于帮助抗击疫情时，人们难得地感到了一丝喜悦。这个例子强调了当我们有一个事件摘要时所获得的额外的洞察力，其中既有对主题的全面覆盖，也有相应的用户反应。了解人们在事件发生时的情绪，可以使政府或组织为他们提供更好的支持，特别是在危机期间。在微博中生成具有连贯主题和情感的事件摘要是一个挑战，因为推文简短而嘈杂，事实充满了用户的情感反应。此外，用户经常跨不同主题使用相同的情感词，并且相同的词可以用于表达事实和情感两者。例如，“孩子们很安全”和“安全”的推文包含“安全”一词。然而，前者传达了孩子们安全的事实，而后者表达了希望一个人保持安全的情感统计主题模型，如[20，25，31，34，38]，基于单词的共现来学习主题同时传达事实和情感的词语可能会导致来自不同主题的推文聚集在一起，从而影响学习模型的质量。这就需要区分一个词是表达事实还是表达情感。在这项工作中，我们提出了一个弱监督的主题情感模型，考虑到传达关于主题的事实信息的单词，以及表达用户情感的单词我们的模型不依赖于标记训练数据的可用性来学习主题和情感。我们总结了事件的代表性微博和情感分布的主题发现。在真实世界事件数据集上进行的大量实验表明，我们的方法能够学习连贯的主题以及事件展开时情绪反应的变化。对墨西哥地震事件的案例研究表明，我们的总结更WWWRrubaa Panchendrarajan，Wynne Hsu和Mong Li Lee487图1：2020年2月6日至4月9日收集的超过320万条推文的COVID-19疫情摘要与最先进的解决方案相比据我们所知，这是第一个包含事实和用户情绪的事件摘要。2相关工作微博中的事件摘要主要集中在生成事件的文本摘要[3，4，10，12，17，32]，而忽略了用户的反应。传统的摘要方法利用k均值聚类[12，32]或检测微博中的音量峰值[3，4，10]来识别子事件并挑选最具代表性的微博来总结子事件。另一种方法采用主题模型对微博进行聚类，然后从每个主题聚类中挑选有代表性的推文[17]。然而，微博的短暂和嘈杂的性质使主题的学习具有挑战性。TwitterLDA [34]假设每个微博都与一个主题相关联，并将微博中的词分为背景词和主题词。 [29]聚合具有相似标签的微博，而[11，25]使用单词嵌入[24]来创建伪文档并直接从这些文档中学习主题。[20，38]使用主题模型本身通过将短文本的伪文档分配建模为潜在变量来生成伪文档所有这些模型在学习主题时都不考虑用户的情绪。有几部作品试图对主题和情感进行建模[36]使用LDA [2]提取主题，并且使用监督式情感分类器确定每个微博客的情感。 [9，16，26，27，35]中的主题情感模型学习监督的主题感知情感分类器。这些模型依赖于标记的训练数据，因此它们推广到新主题的能力有限。其他作品考虑了情感（积极，消极和中性），并采用弱监督方法从文档中学习粗粒度的主题情感。JST [21]用一个新的情感层扩展了LDA，其中单词生成不依赖于不仅在主题上，而且在情感上TS [5]是JST的一个变体，其中情感层和主题层的位置被交换。JST和TS都是为文档设计的，并没有解决从短文本中学习主题的挑战[33]扩展了JST用于微博，并提出了一个名为LDST的主题情感模型，以联合建模主题，情感，时间和地理位置信息，用于跟踪不同位置的用户随时间推移所持有的主题和情感[15]设计了一个基于JST 的模型，称为MJST，并将表情符号作为一个单独的模态。 BST [13]在主题情感层之上强加了一个偏见层，在分配主题情感标签之前将单词分类为主观或客观。这些方法不区分传达关于主题的事实信息的词与用户情感。3情绪主题建模我们设计了一个弱监督的主题-情感模型，称为ETM，它考虑了传达情感的词语中传达事实信息的词语设M为微博的集合每一条微博都经过预处理，转化为一个词袋类似于Twitter-LDA [34]，我们假设每个微博都与一个主题相关联。令Z ={z1，z2，... }是主题的集合，并且E={e1，e2，. }是与主题相关联的情绪的集合。 z ∈ Z和e ∈ E都是某个词汇表V={v1，v2，}上的分布.每个v∈V可以是以下类型之一：(1) 如果它出现在几乎所有与某个事件相关的主题中，则为通用，例如“选举”，“地震”，(2) 具体的，如果它传达了一些事实，例如，“倒塌”，或(3) 如果它表达了某种情感，例如，祈祷。这使得同一个词可以用来表达事实或情感或两者兼而有之。此外，情感词与主题无关，因此同一个情感词可以与不同的主题相关联。在学习过程中，模型对每个单词的单词类型进行微博中的事件摘要机制WWW488ojv.VJeJv.e.v=1λv+czi，n，v=1λv+coj，n，ve=1ek、k、eKKK.我• 如果tj表示通用，则绘制一个单词wjMulti（G）• 如果tj表示情绪，则绘制一个情绪ojMulti（E）然后画一个单词wjK多媒体（MOE）我们采用吉布斯抽样来推断潜在变量z，t和o更新规则如下λS+cz−（i，j）P（tj=S|z，w，.. . ）<$（βT+c−（i，j））×wji，<$，wjSS，i，|.V|S−（i，j）图2：ETM的图形模型表示λG +c−（i，j）P（t =G|w，. ）<$（βT+c−（i，j））×wjG，<$，wj表1：关键符号列表jGG，i，|V|v=1λG+c −（i，j）G，V，vλO+co−（i，j）P（tj=O|z，w，.. . ）<$（βT+c−（i，j））×w jj，，wjOO，i，|.V|O−（i，j）O−（i，j）P（O =e|z，w，.. . ）<$（βE+c−（i，j））×λwj+ce，<$，wjjezi，，e|.V| λO+c−（i，j）Z−（i）v=1.ve，vS+c−（i，j）wjk，n，wjP（zi=k|t，w，o，.. . ）<$（βk+ck，<$）×tj=S|.V|λS+c−（i，j）×E+c−（i，j）ojk，n，ojv=1vk，k，vtj=O|.E|λE+c−（i，j）一旦使用吉布斯采样学习了潜在变量，日可以如下计算特定词分布和k的情感分布话题S（vj）=λS +ck，n，vjE（ej）=βE+ck，，ej在微博中，无论是一般的、具体的还是情绪化的，一般的话，并利用特定的话和情感相关联K|V|v=1 λS+ck，k，vK|E|e=1βE+czi，n，e用情感的话语来确定讨论的话题其中，S（vj）和E（ej）是单词vj的概率，微博。图2给出了图形化模型表示，情感k k表1中概括了所使用的符号。生成过程如下进行：(1) 绘制主题分布图<$Z<$Dir（βZ）(2) 画出类属词分布图GDir（λG）ej分别出现在第k个主题的4事件总结生成微博的时间峰值是一个很好的指标，(3) 对于每个情绪e ∈ {1，2，. }，OO的子事件。我们采用峰值检测算法OPAD [23]，• 画出情感词分布图eDir（λ）确定子事件。(4) 对于每个主题k ∈ {1，2，.，K}，SS我们首先在每个子事件中应用我们的主题-情感模型ETM• 画出具体的单词分布图kDir（λ）• 画出情绪分布EDir（βE）来发现与之相关的热门话题在学习了每个子事件中的(5) 对于每个微博mi，k我们通过汇总每个事件来生成随时间变化的事件摘要• 绘制主题作业ziMulti（Z）具有代表性的微博话题及其情感分布• 画出词型分布图TDir（βT）学我们计算微博m和(6) 对于每个单词wj在MI中，不我主题k的具体词分布如下：• 绘制单词类型赋值tjMulti（i）• 如果tj表示具体，则画一个词wjMulti（S）Ksimilarity（mj，θS）=（1−DKL（Θmj||（1）非政府组织（1）λλ符号描述主任（x）先验x的Dirichlet分布多（x）具有先验x的多项分布Z事件的主题分布B.G.类属词分布电子邮件微博中的词类型分布具体的/一般的/情绪化的OOOe情感词的分布公司简介K主题k的特定词分布EK主题k的情感分布K一些议题cx−（i，j），i，wj号的时间wj被分配给mi中的x，不包括位置（i，j）cx−，（i，j）wj号在除位置（i，j）之外的所有微博中，将时间wj分配给xcx−（i，j），i，#在文档mi中分配给x的单词，不包括位置（i，j）WWWRrubaa Panchendrarajan，Wynne Hsu和Mong Li Lee489（）p（w|D）2周（）下一页{}（）..）其中Θmj是mj的单词分布，DKL norm是Kullback-Leibler（KL）散度的归一化值[18]，它测量两个分布D1和D2之间的距离：来自词典[7]的每个情绪的表情符号和每个情绪的40个词作为情绪种子词。通过保持艾克曼的六大情绪[6]，害怕，愤怒，厌恶，快乐，悲伤和惊讶作为初始DKL（D1）||D2）=.p（w|D1）loдp（w|D1）（二更）种子词，通过迭代地添加它们的同义词来扩展情感种子词。为了公平的比较，我们为所有模型提供相同的情感种子词，较低的KL分歧分数表明两个分布D1和D2彼此更相似选择相似度最高的微博作为代表微博。如果有多个微博具有相同的最高分数，我们选择由拥有最多粉丝和转发数量的用户发布的微博。5评价在本节中，我们使用[1，30，37]发表的数据集评估了我们提出的方法的有效性。我们选择了过去5年中发生的不同类型的事件。我们使用Twit- terAPI 1根据发布的tweet ID检索tweet，并仅保留那些英文tweet。我们通过删除用户提及，URL，停止词和频率小于5的词来预处理推文。推文中剩下的单词、标签（没有#符号）和表情符号构成了词汇表。表2给出了这些事件数据集的特征。表2：事件数据集的统计事件数据集#推特期间#子事件温布尔登668,2802015年7月11日至12日3奥斯卡庆典271,5082016年2月282爱尔兰大选566,1952016年2月3日至3月6日4安大略省竞选1,071,3142018年4月28日至6月14日4墨西哥地震263,3542017年9月30日至10月6日3COVID-19爆发3,182,0172020年2月4日至4月9日85.1主题模型实验我们将我们的情感主题模型ETM与以下主题情感方法进行比较：JST[21]. 该模型通过情感层扩展了LDA，其中生成的单词取决于主题和情感。TS[5]。这是JST的一个变体，其中主题和情感层的位置被交换。LDST[33]. 该情感主题模型联合建模主题，情感，时间和地理位置信息。BST[13]. 这个模型扩展了JST，增加了一个偏置层，其中一个词被标记为主观或客观。• MJST[15].这个模型扩展了JST，加入了表情符号。这些主题情感模型在学习过程中对微博中的每个词的主题和情感进行采样，并生成隐变量的初始化我们还提取了前10个频繁的主题标签作为通用词的种子词表3显示了情感种子词的样本表3：情感种子词样本样本词害怕恐惧无助可怕愤怒生气，烦恼，讨厌，，厌恶厌恶，羞耻，尴尬快乐欢乐，欢呼，爱，，伤心悲伤，悲伤，伤害，，惊喜惊奇，震惊，壮丽，，人工分析显示，大多数子事件都有4-5个主题。6个浓度参数的设置为：βZ= 1，βE= 0。1，βT= 0。1，λG= 0。1，λS= 0。01，且λE= 0。01.小值表示分布集中在一小部分值上[17]。吉布斯采样的老化次数和总迭代次数分别为50和300，如[5，27，35]所示报告的结果是五次运行的平均值5.1.1评价所学习的主题我们首先检查各种方法的有效性，以学习连贯和全面的主题的事件。除了主题情感模型，我们还将ETM与以下模型进行了比较：[34]第三十四话这个方法假设整个tweet只有一个主题。LDA-Agg[29]. 这种方法使用hasthtags来聚类推文，然后使用LDA学习主题[2]。教育统筹局[25]。该方法使用嵌入将短文本聚类成长伪文本，然后推断主题。我们使用逐点互信息度量（PMI）[8，11，38]来衡量通过各种方法学习的主题的一致性PMI背后的直觉是，如果一个主题的顶部单词共同出现的频率相对于单词单独出现的次数来说是频繁的，那么这些单词更有可能形成一个有凝聚力的主题。设W =w1，.....，w N是主题z的前N个词，Pw是使用词w的出现次数确定的词w的概率，并且Pw1、w2是词w1和w2一起出现的概率。则z的PMI由下式给出：每个主题-情感对的词分布，以及学习结束时每个主题的情感分布我们把这些2Ni−1PMI（W）=N（N−1）洛代P（wi，wj）（3）P（wi）P（wj）通过用情感层替换情感层来建立模型尽管我们的模型不需要任何标记的训练数据来学习主题和情感，但我们在初始化潜在变量时为模型提供了一些种子词。我们使用51https://developer.twitter.com/en/docs/api-reference-index.html表4示出了当主题数K被设置为5时各种方法的PMI 我们看到ETM显著优于现有的主题模型以及主题情感模型。请注意，LDA-Agg模型没有结果，因为它无法处理COVID-19数据集中的大量推文。·······i=2j= 1微博中的事件摘要机制WWW490表4：前N个特定词的PMI前N个单词主题模型自适应情感主题模型Twitter-LDA LDA-AggEMBJSTTSLDSTBSTMJSTETM温布尔登50.81260.40910.77140.38690.72930.3450.34380.47040.9615100.4650.27920.54940.17950.5536-0.15670.07070.18030.7333200.07970.02730.1589-0.16810.2342-0.4632-0.2766-0.21140.3859奥斯卡庆典50.72550.67140.67180.35150.61980.20010.47440.35310.9903100.49040.31420.3780.09730.30890.18150.21190.00120.7285200.18250.17920.1333-0.16060.1255-0.1092-0.0763-0.19060.28爱尔兰大选50.68110.44060.43030.20720.53840.26460.00930.22970.9905100.47280.30230.47390.1480.43470.01830.05310.12310.7094200.29990.21990.28070.00920.2627-0.0783-0.06110.01050.4402安大略省竞选50.43140.4240.48510.43470.44540.25330.36830.48210.7764100.35460.36330.38650.28620.32160.16640.21980.30410.657200.24160.26670.30130.15130.2270.06740.08450.17160.4621墨西哥地震50.88490.68070.75840.38320.74730.4780.24120.21281.367100.60050.49350.52610.04710.4489-0.0749-0.1233-0.0441.0337200.20090.31930.2134-0.31560.175-0.4231-0.4118-0.31880.4326COVID-19爆发50.5838_0.47480.1440.4318-0.00430.010.14640.8565100.4874_0.41870.11450.37070.0362-0.0140.05480.6645200.385_0.35740.08840.3145-0.0184-0.03950.02070.477表5：在墨西哥地震数据集中学习到的十大情绪词汇ETMTSMJST害怕可怕的，新鲜的，恐慌，小，，很多，命中，政府，，处理城市，新闻，新的，幸存者，墨西哥-同震，受害者，周，帮助，打击，援助救援，幸存者，搜索，墨西哥，命中，帮助，努力，被杀，受害者，地震愤怒城市，愤怒，余震，建设，重新-海绵，碎石，第三，人，自然，抢救瓦哈卡，人民，搜索，城市，规模，狗，帮助，弗里达，新的，神经过敏受害者，帮助，弗里达，救济，从来没有，索菲亚，幸存者，救援者，捐赠者，响应厌恶带来，弗里达，许多，安慰，母亲，对不起，2，团队，工作新，幅度，2017，城市，动摇，时间，救援，墨西哥地震，收费，帮助狗，救援，罢工，建设，弗里达，生活，rubber，day，ago，km快乐亲爱的、、，太好了，感谢震级，受害者，城市，救援，命中，狗，新的，罢工，努力，分钟，19帮助，人，飓风，受影响，德，波多黎各，请，里科，受害者，救济伤心、、、，祈祷，迷失，，使，悲伤，摇，新，城市，幸存者，帮助，救援，地震，死亡，2，前幅度，新，震动，抖动，命中，2，强烈，地震，救济，南部惊喜政治，好，祈祷，摇滚，谢谢，女孩，该死的，每个人，天哪，漂亮救援，受害者，地震，城市，人，最新，帮助，死亡，飓风，震动magnitude，2017，瓦哈卡，九月，罢工，2，海岸，新的，09，击中5.1.2学习情绪的评价接下来，我们将研究各种模型学习到的主题的情绪分布。表5比较了ETM、TS和MJST学习的情感词我们观察到，ETM学习的大多数情感词传达了用户的情感。相比之下，TS和MJST学习的情感词主要是事实词，并不传达所列出的情感。我们还研究了K主题学习的情感分布的多样性。这由下式给出：休息特别是，墨西哥地震具有高多样性值[0.5-0.7]，这意味着用户对不同的主题表达了非常不同的情绪，例如，为“死亡之钟”而悲伤两个选举数据集的多样性值都很低[0.2-0.3]，表明多个主题显示的情绪范围是相似的。另一方面，其他方法的多样性值几乎接近于零，在多个主题中具有相似ETM之所以能够识别不同的情绪，反应是因为我们考虑一个词的类型，无论它是E1.K .KEE一般的，具体的或情绪化的，同时学习情绪反应多样性（Diversity））=K（K−1） i=1j= 1，ijDKL（中国）||（4）与一个主题相关只有情感词才被分配情感，确保表达用户情感的词被考虑在内其中使用等式2计算D KL。接近零的多样性值指示分布彼此相似。图3显示了当我们将每种情绪的种子单词数量从10个改变到45个时模型的性能。我们观察到，ETM具有最高的多样性相比，在情绪分布中WWWRrubaa Panchendrarajan，Wynne Hsu和Mong Li Lee491(b)温网锦标赛（c）奥斯卡庆典（d）爱尔兰大选(e)安大略省选举（f）墨西哥地震（g）COVID-19爆发图3：不同数量的情感种子大小的多样性5.2事件摘要的实验最后，我们使用墨西哥地震数据集检查各种模型生成的摘要。在这里，每个主题的数量间隔是4。由于数据集没有地面实况主题也没有情感，并且手动浏览数千条推文以识别热门主题和相应的主导情感是不可行的，因此我们选择最小的数据集，即墨西哥地震数据集用于该实验。三名志愿者分别被要求选择四条有代表性的推文，并确定对该主题表达的主导情绪（如果有的话）。我们使用ROUGE度量[22]来评估各种模型生成的摘要的文本内容的质量。表6显示了由ETM和其他主题和主题情感模型生成的摘要的ROUGE的四种变体。我们看到ETM在所有变体中获得了最高分。表6：墨西哥地震的平均ROUGE评分ROUGE-LRouge-1ROUGE-2ROUGE-3Twitter-LDA0.36330.43240.17850.1183LDA-Agg0.33650.42260.15970.0923EMB0.30510.43570.14470.0467JST0.36420.44620.18940.1178TS0.35380.43910.18870.1231LDST0.3330.41830.15170.0788BST0.3580.44180.17740.0946MJST0.34610.43790.17060.0897ETM0.42410.47870.23910.1652我们比较了墨西哥地震数据集的ETM与TS和MJST生成的摘要。图4显示了TS、MJST和ETM在前两个子事件中生成的摘要。的表7：墨西哥地震前两个子事件所涉主题子事件Ground Truth主题TSMJSTETM1帮助受害者✓✓✓学校倒塌✓✓✓搜寻幸存者✓✓✓死亡人数✓✓✓2帮助受害者✓✓✓死亡人数✓✗✓新地震✓✓✓拯救弗里达✗✓✓覆盖0.8750.8751在代表性微博中突出显示每个主题的前5个词我们观察到，对于TS和MJST，所学习的主题是不同主题的混合物，并且所学习的情绪几乎均匀分布，没有明显的主导情绪，这对决策者来说不是很有用无法区分情感响应的一个可能原因是因为它无法区分传达事实信息的单词和用户情感。因此，传达事实信息的词语得到情感分配，导致均匀分布的情感分布。另一方面，由ETM生成的摘要捕获大多数地面实况主题的主导情绪以及跨主题的情绪随时间的变化，例如，害怕表7和表8显示了在墨西哥地震的前两个子事件中由ETM、TS和MJST识别的主题和相应的主导情绪，以及从人类志愿者获得的地面实况主题和主导情绪我们看到，由我们建议的ETM生成的摘要具有最高的覆盖率微博中的事件摘要机制WWW492(a) TS墨西哥地震综述(b) MJST对墨西哥地震的总结(c) 墨西哥地震ETM分析总结图4：TS、MJST和ETM生成的摘要WWWRrubaa Panchendrarajan，Wynne Hsu和Mong Li Lee493表8：墨西哥地震前两个子事件中的主导情绪。子事件主导情绪TSMJSTETM1快乐✗✓✓伤心✗✗✗害怕✗✗✓伤心✓✗✓2快乐✗✓✗伤心✓✗✓害怕，悲伤✓✗✓快乐✗✗✓精度0.3750.250.75能够更好地捕捉用户的情感反应，准确率为0.75。6结论在这项工作中，我们已经描述了一个情感主题模型称为ETM总结的主题和情绪的事件。所提出的模型已经考虑到一个词是通用的，具体的或表达的情感的用户。一种弱监督学习方法被设计用来捕捉事件展开时的连贯主题和情感反应。在多个真实世界数据集上的大量实验表明，我们的情感主题模型在PMI和KL Divergence指标方面我们还使用ROUGE分数评估了生成的摘要的质量，并表明ETM提供的事件摘要更好地覆盖了主题，并传达了更多样化的用户情绪。未来的工作包括多媒体和多平台的事件摘要，以及探索方法来生成一个新的摘要，而不是选择有代表性的推文。引用[1] Firoj Alam，Ferda Ofli，and Muhammad Imran.2018年Crisismmd：来自自然灾害的多模态Twitter数据集第十二届AAAI网络和社交媒体国际会议。[2] David M.作者：Andrew Y.Ng和Michael I.约旦. 2003年。潜在Dirichlet分配 J. 马赫学习. Res. 3（2003年3月），993-1022。[3] Carmen De Maio，Giuseppe Fenza，Mimmo Parente.2016年。twitter微博摘要的时间感知知识抽取信息融合28（2016），60-74。[4] 高文杰，李德宏，张仁贤2013年。顺序摘要：一个新的应用程序，用于及时更新Twitter趋势主题。在计算语言学协会第51届年会上。567-571[5] Mohamed Dermouche，Leila Kouas，Julien Velcin，and Sabine Loudcher. 2015.一种基于文本的主题-情感联合建模模型。第30届ACM应用计算年会论文集。ACM，819[6] Paul Ekman，E Richard Sorenson，and Wallace V Friesen.一九六九年情绪面部表情的泛文化因素Science164，3875（1969），86[7] Abdallah El Ali，Torben Wallbaum，Merlin Wasmann，Wilko Heuten，and Su- sanne CJ Boll.2017. Face2juji：使用面部情绪表情过滤juji。在2017年CHI会议的程序扩展摘要在计算系统中的人为因素（丹佛，科罗拉多州，美国）（ CHI EA '17 ）。 ACM ，纽约，纽约，美国， 1577-1584 。https://doi.org/10.1145/3027063.3053086[8] Anjie Fang ， Craig Macdonald ， Iadh Ounis ， and Philip Habel.2016年。主题在推文：Twitter数据的主题一致性度量的用户研究欧洲信息检索会议。斯普林格，492[9] Jiachun Feng ， Yanghui Rao ， Haoran Xie ， Fu Lee Wang ， and QingLi.2019年。基于用户组的短文本情感检测与主题发现万维网（2019），1-35。[10] D. 高，W.Li，X.蔡河，巴西-地Zhang和Y.欧阳。2014年。顺序摘要：Twitter趋势主题的完整视图IEEE/ACM Transactions on Audio，Speech，and LanguageProcessing 22，2（Feb 2014），293-302.[11] WangGao，Min Peng，Hua Wang，Yanchun Zhang，Qianqian Xie，and Gang Tian. 2018年将词嵌入技术应用于短文本的主题建模知识与信息系统（2018年12月18日）。https://doi.org/10.1007/S10115-018-1314-7[12] Mehreen Gillani ， Muhammad U. 放大图片作者： Jalal S.Alowibdi ， NaifAljohani和Fahad S.Alotaibi 2017年。体育赛事微博的后摘要在第26届万维网公司国际会议（澳大利亚珀斯）（WWW国际万维网会议指导委员会，瑞士日内瓦共和国和州59[13] 郭俊才和薛晨。2018年微博情感分析的偏见-情感-主题模型。并发和计算：实践和经验30，13（2018），e4417。[14] 何瑞芳和段兴义。2018年基于社会网络和稀疏重构的推特摘要。第32届AAAI人工智能会议。[15] Faliang Huang，Shichao Zhang，Jilian Zhang，and Ge Yu.2017年。多模态学习在微博话题情感分析中的应用神经计算253（2017），144[16] Minghui Huang ， Yanghui Rao ， Yuwei Liu ， Haoran Xie ， and Fu LeeWang.2018年基于Siamese网络的有监督主题建模。2018年自然语言处理经验方法会议论文集。4652-4662[17] 汉王张景文卞，杨洋，蔡达成2015年。微博流中社会事件的多媒体摘要。 IEEETransactions onMultimedia，Vol.17。216[18] 所罗门·库尔贝克和理查德·A·莱布勒。一九五一年关于信息和充足性。数学统计年鉴22，1（1951），79[19] 李全志和张琼。2020年。Twitter上的抽象事件摘要在2020年网络会议的配套程序中。22比23[20] Ximing Li，Changchun Li，Jinjin Chi，and Jihong Ouyang.2018年探索原始文档的短文本主题建模知识与信息系统56，2（2018），443-462。[21] 林成华和何玉兰。2009年情感分析的联合情感/主题模型第18届ACM信息与知识管理会议论文集。ACM，375[22] 林金耀2004年。Rouge：一个自动评估摘要的软件包在文本摘要分支。74比81[23] 亚当·马库斯、迈克尔·伯恩斯坦、奥萨马·巴达尔、大卫·R·卡格、塞缪尔·马登和罗伯特·C·米勒。2011. Twitinfo：聚合和可视化微博事件探索。在SIGCHI计算机系统中的人为因素会议上。ACM，227[24] 托马斯·米科洛夫，温陶·易，杰弗里·茨威格。2013. 连续空间词表示的语言规律。 2013年计算语言学协会北美分会会议论文集：人类语言技术（佐治亚州亚特兰大）。计算语言学协会，746-751。[25] Jipeng Qiang，Ping Chen，Tong Wang，and Xindong Wu.2017年。基于词嵌入的短文本主题在知识发现和数据挖掘的进展中，Jinho Kim，KyuseokShim，Longbing Cao，Jae-Gil Lee ，Xuemin Lin 和Yang-Sae Moon （编辑）。Springer International Publishing，Cham，363-374.[26] Yanghui Rao，Jianhui Pang，Haoran Xie，An Liu，Tak-Lam Wong，QingLi，and Fu Lee Wang.2017年。用于短文本情感检测的有监督密集主题模型。在DASFAA。[27] Yanghui Rao，Haoran Xie，Jun Li，Fengmei Jin，Fu Lee Wang，and QingLi.2016年。基于主题级最大熵模型的短文本社会情感分类。信息&管理53，8（2016），978-986。[28] KoustavRudra 、 Subham Ghosh 、 Niloy Ganguly 、 Pawan Goyal 和SaptarshiGhosh。2015.灾害事件中微博情境信息的提取：一种分类汇总方法。第24届ACM国际信息与知识管理会议论文集。ACM，583-592.[29] 阿斯比约恩·斯坦斯科格、乔纳斯·瑟克尔森和比约恩·甘贝克。2017年。Twitter主题建模通过推文聚合。第21届北欧计算语言学会议（瑞典哥德堡）。计算语言学协会，77-86。[30] Akanksha Tiwari，Christian Von Der Weth和Mohan S.坎坎哈利2018.多模式多平台社交媒体事件摘要。ACM多媒体计算Commun. Appl. 14，2s，Article38（April 2018），23 pages. https://doi.org/10.1145/3115433[31] 袁望，刘杰，曲季石，黄亚楼，陈吉梦，夏峰。2014年。基于主题标签图的推文挖掘主题模型2014 IEEE InternationalConference on Data Mining（2014），1025-1030.[32] Z. 王湖，加-地Shou，K.Chen，G.Chen和S.梅赫罗特拉2015年。演化推文流的摘要和时间轴生成 IEEE Transactions onKnowledge and Data Engineering27，5（May2015），1301-1315。https://doi.org/10.1109/TKDE.2014.2345379微博中的事件摘要机制WWW494[33] 杨敏，梅金城，季恒，周钊，陈晓军，等.2017年。识别和跟踪自然灾害期间社交媒体文本中的情绪和主题。2017年自然语言处理经验方法会议论文集。527-533[34] Wayne Xin Zhao ， Jing Jiang ， Jianshu Weng ， Jing He ， Ee-Peng Lim ，Hongfei Yan，and Xiaoming Li.2011年。使用主题模型比较Twitter和传统媒体信息检索进展。 Springer Berlin Heidelberg，柏林，海德堡，338-349.[35] Wenjie Zheng，Zenan Xu，Yanghui Rao，Haoran Xie，Fu Lee Wang，andReggieKwan. 2017年。基于情感语境的短文本情感分类2017行为，经济，社会文化计算国际会议（BESC）（2017），1-6。[36] 周青青和张成智2017年。微博热点事件子话题的情感演变电子图书馆35（072017），00https://doi.org/10.1108/EL-09-2016-0184[37] 阿凯兹·祖比亚加 2018年twitter 数据集持久性的纵向评估。Journal of theAssociation for Information Science and Technology69，8（2018），974[38] Yuan Zuo，Junjie Wu，Hui Zhang，Hao Lin，Fei Wang，Ke Xu，and HuiXiong.2016年。短

下载后可阅读完整内容，剩余1页未读，立即下载