社交媒体中的压力和放松检测方法及其性能改进

116 浏览量更新于2023-10-16 收藏 12.56MB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

16770用于推文的压力和放松程度的检测0Reshmi Gopalakrishna Pillai信息与语言处理研究所英国伍尔弗汉普顿大学reshmi.g85@gmail.com0Mike Thelwall 信息与语言处理研究所英国伍尔弗汉普顿大学M.Thelwall@wlv.ac.uk0Constantin Orasan信息与语言处理研究所英国伍尔弗汉普顿大学C.Orasan@wlv.ac.uk0摘要0自动检测人类压力和放松的能力对于及时诊断与压力相关的疾病、确保服务中的客户满意度以及管理以人为中心的应用程序（如交通管理）至关重要。传统方法采用测量压力的量表或生理监测，这可能具有侵入性和不便。相反，社交媒体的普遍性可以用来识别压力和放松，因为许多人习惯通过社交网络网站分享他们最近的生活经历。本文介绍了一种改进的方法来检测社交媒体内容中的压力和放松表达。它使用词义向量的词义消歧来提高基于词典的压力/放松检测算法TensiStrength的性能。实验结果表明，词义消歧显著提高了原始TensiStrength的性能。在皮尔逊相关系数和准确匹配百分比方面，它的表现优于最先进的机器学习方法。我们还提出了一个新颖的框架，用于识别推文中压力和放松的因果因素作为未来的工作。0CCS概念0• 信息系统 → 信息检索 → 检索任务和目标 → 情感分析 •人类中心计算 → 协作与社交计算 → 社交媒体 • 计算方法学 →人工智能 → 自然语言处理0关键词0压力；社交媒体；Twitter；情感分析；词义消歧；词向量0本文根据知识共享署名4.0国际（CC-BY4.0）许可证发布。作者保留在个人和公司网站上传播作品的权利，并附上适当的归属。WWW 2018，2018年4月23日至27日，法国里昂。©2018IW3C2（国际万维网会议委员会），根据知识共享CC BY4.0许可证发布。ACM ISBN 978-1-4503-5640-4/18/04 DOIhttps://doi.org/10.1145/3184558.31916270ACM参考格式：0R. Gopalakrishna Pillai, M. Thelwall, C. Orasan. 2018.用于推文的压力和放松程度的检测. 在2018年Web会议伴随会议（WWW'18Companion），2018年4月23日至27日，法国里昂，ACM，纽约，NY，8页。DOI: https://doi.org/10.1145/3184558.319162701 引言0在健康领域中，识别压力和放松的能力对于作为健康相关疾病的诊断工具、以客户为中心的企业检测不愉快的体验（例如旅游业）以及管理大规模人类的系统（例如交通、人群管理）都非常重要。早期发现压力可以帮助采取行动避免情况升级或未经治疗。根据情况，这些行动可能包括为与压力相关的疾病推荐医疗咨询、更改酒店运营程序以避免客户压力高点、将压力过大的客户转接给人工坐席而不是自动电话坐席，或触发紧急交通管理措施。同样，衡量和了解放松的原因也很重要，因为它是与压力相反的情感状态，也是对应用和服务满意度的指标。传统上，压力和放松是通过监测生理参数的变化或针对心理表现的发生的问卷调查来衡量的。尽管这些方法被广泛接受，但也存在一些局限性。测量物理参数的传感器可能昂贵且耗时。另一方面，通过心理问卷诊断压力和放松往往受到参与者操纵答案的影响，他们可能会为了给自己树立更好的形象而给出回答，而不是诚实地表达自己的心理状态。0社交网络网站在个人和广播通信中都很受欢迎。人们习惯在社交媒体平台上分享他们生活的更新。他们的在线活动和互动可以预期在一定程度上反映离线事件和状态。这可以用来以非侵入性的方式评估用户的压力和放松水平。0从社交媒体内容中检测压力和放松是一个尚未被充分探索的研究领域。当前的研究0研讨会：第六届自然语言处理国际研讨会，2018年4月23-27日，法国里昂 16780实现了基于向量的词义消歧（WSD）系统，以改进第一个基于词典的压力/放松检测方法TensiStrength[1]在Twitter上的性能。结果表明，将WSD作为预处理阶段显著提高了TensiStrength的准确性，这个修改后的系统的性能也优于标准的机器学习算法。新的贡献总结如下：01. 首次将WSD与社交媒体内容研究中的压力/放松检测相结合。02.分析属于各种领域的推文中的压力/放松表达，如交通、政治、生活事件和体育。03.引入了一个更新的词典，其中包含适应多义性的情感词的压力/放松分数。02 文献综述02.1 传统的压力/放松测量方法0经典著作《生活的压力》[2]将压力定义为身体对任何变化需求的非特异性反应。这个定义提出了压力的两个不同但相关的方面：刺激，即变化的需求，以及反应。后者可以表现为不同形式，主要是生理参数的变化。压力通常通过监测指示性参数（如心率[3]、皮肤电反应[4]和瞳孔直径[5]）来测量。另一种方法是使用问卷调查来发现易于产生压力的A型人格[6]或产生压力的生活事件[7]。这些方法大多是被动的，需要研究人员持续监测昂贵的传感器或依赖于可能不愿意分享自己心理状态的用户或操纵自己的回答以满足自我设定的心理形象。这些限制促使我们开发新颖的、不显眼的信息来源来分析压力和放松的表达。02.2 从社交媒体内容中识别压力和放松0社交媒体的普及使其成为行为和心理健康评估的潜在工具。分析互联网使用模式[8]和Facebook状态更新[9]已被确认为识别患有抑郁症风险的人群的非传统、创新方法。已经努力研究Twitter的内容，以寻找抑郁症[10]或创伤后应激障碍(PTSD)[11]等心理健康障碍的指标。关于在社交媒体帖子中挖掘心理疾病指标的潜力，包括多媒体机会和伦理挑战，在[12]中有所涉及。在相关工作中，推文被视为有关新母亲产后情绪和行为变化的预测模型的输入[13]。通过观察产前行为，特别是0这些模型可以通过参与度、情绪、自我网络和语言风格等属性对产后情绪和行为发生显著变化的母亲进行分类，准确率为71%，同时还考虑了初始产后数据。类似地，在[10]中，利用众包的Twitter用户数据来构建一个在发病前预测风险的分类器。该研究进一步分析了数据集的特征，观察了抑郁症和非抑郁症类别的昼夜模式、社交联系和发帖量。该模型能够以72.384%的准确率预测抑郁症的发病，包括所有特征和降维。[11]使用自动分析和手动修正来寻找PTSD的正负样本。这些用户发布的推文在一段时间内被收集，以创建一个正负PTSD数据的语料库，用于训练三个不同的分类器。这些分类器被用来识别和评估军事和平民人群中的PTSD趋势。这种方法进一步改进了[14]，以寻找双相障碍、重度抑郁障碍和季节性情感障碍的指标。TensiStrength是第一个能够检测推文中表达的压力和放松强度的系统。它主要是一种词汇方法。词典部分来源于LIWC [15]、General Inquirer[16]和SentiStrength[17]中的情感词汇，后者是一种类似的基于词典的情感分析程序。在最初的评估中，对3066条英文推文进行了人工编码，根据五点评分对压力和放松进行评估：-1表示没有压力，-5表示最高压力；+1表示没有放松，+5表示最高放松。它的性能与包括支持向量机在内的几种机器学习算法相似。[18]中描述的混合系统结合了因子图模型和卷积神经网络（CNN），估计了用户心理压力水平与他们的社交网络互动之间的关系。这种方法在F1分数方面将压力检测提高了6-9%，并用于研究压力和非压力用户的社交互动。Moodee[19]是一个实用的移动应用程序，解决了从社交媒体内容中检测压力的挑战，包括缺失数据、时间序列建模和数据稀疏性问题。它提取了[20]中定义的推文级语言、视觉和社交属性。这些属性被输入到交叉自动编码器中，这些编码器嵌入在CNN中，将它们与用户级内容属性[21]集成在一起。该系统推荐给用户一些链接以缓解压力。[22]中描述的系统可以识别社交媒体文本中的压力。它使用压力事件类别和压力主题以及与每个类别和主题相关的一系列词语，基于词嵌入的基础上进行识别。压力事件和主题使用一种将多任务学习与CNN相结合的新型混合模型进行识别。推文根据社交调整评定量表[7]被分配一个压力值。压力0研讨会：第六届自然语言处理国际研讨会，用于社交媒体的WWW 2018，2018年4月23日至27日，法国里昂 16790以这种方式获得的分数与一些最先进的机器学习模型相当。如上所述，迄今的研究主要关注压力的健康影响，试图在反应性的方式下识别和治疗症状。对压力和放松的根本原因进行的分析非常少。相比之下，一项开创性的尝试[7]寻找压力和放松的原因，将其兴趣范围限制在个人事件（如离婚、死亡和分娩）等方面。而我们的研究则分析了在交通、政治、个人事件和学术等各种情境中表达短期或长期压力和放松的推文。02.3 情感分析中的词义消歧0检测压力或任何情感状态表达的一个重要挑战是社交媒体文本使用非标准语法和非正式语言。情感词可能是模棱两可的，根据上下文而改变其意义。例如，在“空气中有一丝寒意”中，情感词“寒意”表示压力，而在“我是一个相当放松的人”中，它表示放松。解决这个词义的意义对于正确识别压力至关重要。自然语言处理任务中的WSD，即在计算方式下识别上下文中单词的意义[23]，是对这个问题的传统响应。0一个使用Babelfy和SentiWordNet的WSD系统[24]展示了它如何提高Twitter和短信测试数据中的情感检测准确性。Babelfy是一种基于图的多语言词义消歧方法，它基于语义网络BabelNet3.0。使用Carnegie Mellon University（CMU）TwitterNLP工具和NLTK对推文进行了预处理。推文被表示为具有三个特征的向量-对应于SentiWordNet中的单词的正面、负面和中性得分的总和。基于这些表示训练了一个监督式的随机森林决策树分类器。该系统的准确性（58.55%）比基线方法（45.26%）更高。该论文证明了WSD提高了社交媒体数据（特别是推文）的情感分析准确性。0一项关于比喻语言的情感分析的研究工作[25]应用了WSD，并通过基于图的方法为词义分配极性。此外，基于两个隐藏马尔可夫模型分别针对正面和负面情况检测句子级的极性。该系统在召回率和准确率方面与没有WSD的极性检测方法和基线WSD方法（将WordNet的第一个词义条目分配给所有词义）相比有显着更好的效果。0将基于口碑文档的WSD纳入SentiWordNet词典[26]，发现可以提高情感分析性能。类似地，一个WSD系统[27]使用基于路径的语义相关性来找到最合适的意义，并且发现对情感分析任务的分类f-score有更好的效果。0另一项研究[28]将使用扩展的词义解释重叠（extended glossoverlap）的WSD算法与VoxPop[30]集成，0基于SentiWordNet的文本极性分类器，将准确率从50.5%提高到60.0%。0尽管在方法和词汇资源上有所不同，但这些研究表明，具有WSD的情感分析系统明显优于没有WSD的系统。然而，将WSD纳入压力/放松分析的影响以前从未进行过研究，我们的研究将其视为改进现有词汇方法准确性的潜在途径。02.4 词向量表示及其在词义消歧中的应用0用于词义消歧的标准自然语言处理方法是基于标准语法和拼写的，而这在社交网络中并不常见。一种适用于非正式文本的词义消歧方法是将一个词表示为一个实值向量，记录其上下文词的频率（例如，在同一句子中）。这可以与不同词义的类似聚合向量进行比较，并选择最相似的向量来选择最可能的词义。GloVe是一种无监督学习算法[30]，而Word2Vec [31,32]是用于找到词的向量表示的两种最常见的架构。Word2Vec使用两个模型中的连续向量表示词 -词袋模型和Skip-gram模型。在词袋模型中，目标是在给定输入上下文词的情况下预测中心词。另一方面，Skip-gram模型的输入向量是焦点词，目标是预测上下文词。GloVe模型旨在将Skip-gram模型的优点与使用矩阵分解方法的全局词共现统计信息相结合。0Sense2Vec[34]是一种监督式的词义嵌入系统，可以根据上下文区分同一个词的不同意义。该系统利用监督式的自然语言处理标签来确定实例中的词义。这减少了计算开销，使其更适用于计算密集型的自然语言处理任务。在传统的自然语言处理任务中，如命名实体解析、情感消歧和词性标注，它被证明是一种高效的词义消歧方法。0类似地，已经提出了一种基于Skip-gram模型的词向量和WordNet解释的词义向量方案用于词义消歧[34]。本文提出的算法分为两个步骤：词和词义向量的初始化以及词义消歧。在第一步中，通过Skip-gram模型学习词向量，并从中构建每个词义的词义向量。对于解释中的每个词，计算与原始词的余弦相似度。那些余弦相似度高于阈值的词被添加到候选集中。候选词的向量的平均值被视为词义向量。0在词义消歧的第二步中，给定一个句子，通过找到内容词向量的平均值来计算初始上下文向量。与上下文向量的余弦相似度最高的意义被视为消歧结果。我们在当前的实验中使用词向量实现了这种意义消歧方法。0Track：第六届国际社交媒体自然语言处理研讨会WWW 2018，2018年4月23日至27日，法国里昂 (-3, +1) (-3, +1) (-3, +2) (-3, +2) (-1, +2) (-1, +2) (-1, +2) (-2, +1) 16800我们选择了这种统一的向量模型或词义表示和消歧的研究，原因如下：01.它使用预定义的意义库。在我们的实现中，我们在实际处理推文之前预先计算了这些向量表示，从而最大程度地减少了计算开销。02.该系统全面覆盖了标准词汇资源WordNet中的所有意义，每个意义都用相应的向量表示。它利用了WordNet中的高质量解释，从而为具有可靠语义上下文的词义形成了基础。03 方法论03.1 概述0本研究的目的是通过引入预处理阶段来消除推文中模棱两可的情感词，从而增强现有的TensiStrength方法以识别应激/放松强度。这是通过实施[34]中提出的词义消歧解决方案来实现的，即找出在一组候选词义中，哪个词义向量与表示上下文/句子的向量具有最高的余弦相似度。改进版TensiStrength与经典TensiStrength进行了性能比较，并且在应激/放松准确性方面始终表现更好。03.2 工作流程0基本方法是在原始的TensiStrength系统中设计的，并在这个修改版本中遵循，即为每个句子分配两个分数：其中一个是句子中最高的压力词的分数，另一个是句子中最高的放松词的分数，通过一些规则来修改这些分数，这些规则涵盖了拼写、否定和增强词等问题。双重评分是基于这样的观察：同一个句子可能包含压力和放松的表达。在原始和修改后的TensiStrength中，分配压力/放松值时考虑的规则如下：01.两个或更多重复的字母将压力/放松值增加1。（scarryy的压力值比scary高。）2.成语被视为单个单元，具有分配的压力/放松值。忽略了各个单词的分数。3. 对压力词的否定使其中和。4.对放松词的否定使其成为压力词。5.表情符号被分配适当的压力/放松值。6.拼写纠正以删除重复的字母形成单词。0图1：经过修改的TensiStrength算法（带有WSD）对推文的处理工作流程（Figure1）在当前工作中，我们通过添加一个预处理步骤来修改TensiStrength，该步骤实现了WSD。首先，它使用Word2Vec从WordNet的一系列词义中选择一个词义。然后，将具有正确消歧的情感词的预处理推文传递给基于词典的压力/放松幅度检测方法，该词典扩展了不同词义的不同分数，而不是以前的TensiStrength中的单一分数。0表1.TensiStrength分配的具有压力/放松值的推文示例（突出显示了情感（压力/放松）词）0推文TensiStrength没有WSD0带有WSD的TensiStrength0未来看起来0不确定和忧郁0每个人都在0山谷有着沉重的心情，但最好的事情是崇拜0她穿着一件时髦的粉色连衣裙0那位女士给了我一个冷漠的眼神0在第一个示例（表1）中，有两个压力词uncertain和glum，它们的压力强度分别为-3和-2。将最高压力词的分数分配给推文。在第二个推文中，有两个情感词，一个用于压力，一个用于放松，推文被分配了与这些词对应的压力和放松分数。TensiStrength没有WSD为最后一个示例分配了放松强度+2和压力强度-1。在修改后的版本中，WSD模块识别了给定上下文中情感词‘cold’的正确意义，并分配了压力强度-2和放松强度+1。0Track:第六届国际社交媒体自然语言处理研讨会WWW 2018，2018年4月23日至27日，法国里昂 3.3 Extending lexicon of TensiStrength to incorporate ambiguity of affect words 16810TensiStrength使用了一种基于词汇的方法，其中包含了一系列带有压力和放松强度标注的术语。TensiStrength的词典是由LIWC[15]、General Inquirer [16]以及情感检测程序SensiStrength[17]的词典组合而成，并添加了一些手动添加的词语。我们在现有的TensiStrength词典中识别出了40个模糊的情感词，并手动更新了这些词的不同意义的压力/放松值。需要注意的是，虽然语言中包含了更多的模糊词，但在这个实验中，我们只考虑了那些已经存在于TensiStrength词典中的模糊词作为情感词。完整的列表见表2。例如，没有词义消歧的TensiStrength词典中只有一个词‘cool’的条目，表示为+2，表示中等放松。但是修改后的词典承认了同一个词的不同意义，这些意义来自于WordNet资源。例如，WordNet中‘cool’的第九个意义是‘不友好或不响应或表现出不喜欢’，这表示压力，因此被赋予了-2的值。同样，这些模糊词的不同意义也被赋予了适当的压力/放松值。词义的序数由原词后缀表示。表中给出了词典的一些示例添加，以及分配的压力/放松强度和WordNet的解释。表2列出了在修改后的TensiStrength词典中更新了压力/放松分数的模糊情感词的列表。fine concern0堵塞黑暗0公平紧0紧张火0阻碍崩溃0冷静毁坏重压力烟0税冷凉快呛棍子0晚动荡充满激进噪音0浪费批评的把戏抗议压力0场景疯狂的艰难的计划事故0人为的厚颜无耻的冷酷无情的粗鲁的沙漠表3.TensiStrength词典中添加的示例应力/放松分数0WordNet的意义描述0fine_1 -3 好，罚款，罚款（作为处罚而收取的钱）0fine_2 -3 发出罚单或罚款作为处罚0fine_3 2好的，不错，好，好的，还好，很好，很棒（令人满意或处于令人满意的状态）0cool_2 3 沉着，自信，冷静，沉着，镇定0cool_9 -2 心理上的冷静和0不热情的；不友好的或0无反应或表现出不喜欢03.4 数据集和注释在一个月的时间内（从2017年2月1日到2017年3月1日），收集了一千条带有模糊情感词（例如fine）的推文作为实验的数据集。这些推文由三名人类编码者独立进行标注，使用五分制对其进行了压力和放松程度的标注。编码者在TensiStrength实验中参与了相同的标注过程，因此他们在压力/放松程度标注任务上有先前的经验。推文根据压力和放松程度进行了标注，分数范围从+1到+5（+1表示没有放松，+5表示非常高的放松），从-1到-5（-1表示没有压力，-5表示非常高的压力）。对于每条推文，计算了三名编码者标注分数的算术平均值，并四舍五入到最近的整数值。这被视为压力和放松值的黄金标准。使用Krippendorff's α[37]计算了每对编码者之间的一致性，并发现具有较高的正值。Krippendorff建议α的最低可行限制>0.667。三名编码者在压力（0.778）和放松（0.781）方面的整体一致性足够高。下表比较了与类似实验中编码者之间的一致性。表4.压力值注释的编码者间一致性方法 A和B B和C A和C0Krippendorff's α 0.774 0.781 0.7710皮尔逊相关系数 0.796 0.814 0.7920表5. 松弛注释的编码者间一致性方法 A和B B和C A和C0Krippendorff's α 0.751 0.802 0.7810皮尔逊相关系数 0.796 0.820 0.7970后续实验中较高的一致性值表明编码者在标注任务上持续改进。这也表明问题陈述和标注说明是明确的。03.5 实验设置0使用在ACL W-NUT任务[19]中发布的训练了4亿条推文的TwitterWord2Vec模型来训练此实验的单词和意义向量。对于前一部分提到的模糊词列表中的每个词，我们计算了维度为200的向量，对应于每个不同的意义，将WordNet视为意义库存。基于[11]中提出的方法实现了基于WSD模块，使用AnacondaPython（版本为Anaconda-4.4.0和Python-3.6.1）包，特别是Scipy，Numpy和nltk，作为我们的研究工作的一部分，以评估其在压力和放松程度检测方面的改进。0Track:第六届国际社交媒体自然语言处理研讨会WWW 2018，2018年4月23日至27日，法国里昂 (-3, +1) (-4,+1) (-1, +3) (-1, +2) 168204 结果04.1 TensiStrength与WSD的性能在使用TensiStrength与WSD检测推文中的应力和放松的准确性方面，与没有WSD预处理阶段的TensiStrength以及一系列标准机器学习算法进行了比较：自适应增强算法（AdaBoost）、朴素贝叶斯分类器（Bayes）、决策树（J48Tree）、逻辑回归（Logistic）和支持向量机（SVM）。特征使用了一元、二元和三元。每个分类器都使用Weka3.6中的配置进行实现，使用10倍交叉验证评估机器学习算法的性能，重复30次，并记录30次迭代的平均分数。0根据与人工注释数据的Pearson相关系数和完全匹配百分比，发现具有预处理阶段以消除词义歧义的TensiStrength比最先进的机器学习算法和没有预处理的TensiStrength表现要好得多。结果总结在表5、6中。0表5. 应力检测结果方法 Pearson相关系数完全匹配百分比百分之一以内匹配百分比0AdaBoost 0.3543 30.1671 83.15620贝叶斯 0.3238 35.3464 90.1824 J48树 0.4649 47.456288.3543 逻辑回归 0.4948 49.2679 89.2167 SVM 0.512451.2543 91.5626 TensiStrength无WSD 0.4735 48.811283.23670TensiStrength与WSD 0.5443 53.1091 92.41370表6. 放松检测结果方法 Pearson相关系数完全匹配百分比百分之一以内匹配百分比0AdaBoost 0.3254 34.1335 83.54510贝叶斯 0.3577 38.9221 84.6735 J48树 0.5224 51.563486.1734 逻辑回归 0.4987 54.3267 89.1798 SVM 0.554658.7324 91.6598 TensiStrength无WSD 0.5304 56.387885.83640TensiStrength与WSD 0.56441 60.6981 93.12270可以观察到，WSD阶段在Pearson相关系数、完全匹配百分比和1以内匹配百分比方面显著提高了应力/放松检测的准确性。TensiStrength在具有WSD的情况下的表现也优于机器学习方法。然而，需要注意的是，注释数据集（和训练数据）的规模较小可能是相对较差表现的主要原因。0机器学习方法。更多推文的结果可能更好地证明TensiStrength与WSD相对于标准机器学习方法在应力和放松检测方面的优越性。此外，当前数据集中的推文包含添加到TensiStrength词典中的歧义词。在随机选择的一组推文上的性能可能会有所不同。4.2 错误分析WSD模块在没有直接影响词或带有上下文词误导WSD模块的影响词的推文中发生误解的应力/放松表达。在第一类中，我们可以找到诸如“我是一场火车失事”或“我有一个沉重的心要承担”的推文。对于“我是一场火车失事”，正确（人工注释的）应力得分为-3，对于“我有一个沉重的心要承担”，正确得分为-4。然而，WSD模块错误地消除了歧义影响词（失事，沉重）的意义，因为上下文词“火车”和“承担”，并将较低的应力得分-2分配给两者。没有WSD的TensiStrength仅根据存在的影响词的词典得分给出得分。表7. 错误示例推文正确得分0TensiStrength得分（无WSD）0TensiStrength得分（WSD）0情感词0上下文词0我是一个0人类火车失事0（-3，+1）（-2，+1）火车失事0我有一个0沉重的心情0（-2，+1）（-2，+1）沉重的负担0很棒的夜晚，疯狂的人群，谢谢大家0（-1，+2）（-3，+1）疯狂的人群0抗氧化剂消除自由基的破坏潜力0（-2，+1）（-2，+1）激进的破坏性0另一个误差来源是压力和放松的间接表达。我们数据集中的例子有“坐在火边；生活中的小事”（正确的压力放松分数是（-1，+4），我们系统的分数是（-2，+1））。“竭力倾听笑声片段；却什么也听不到”（正确分数（-2，+1），我们系统的分数（-1，+3）。这种间接表达对于所有自动化系统来说都很具有挑战性，因为它们很难找到情绪或压力的强度。4.3推文的压力/放松领域分析我们手动将推文分类为以下领域之一：学术、商业、气候、娱乐、食品、健康0Track: The Sixth International Workshop on Natural Language Processing for Social Media WWW 2018, April 23-27, 2018, Lyon,France 16830个人事件、政治、宗教、体育和旅行。对TensiStrength在不同领域中的压力/放松值和性能进行了分析，总结如下表格，表8和表9。表8.TensiStrength在不同领域中的压力检测性能（包括和不包括WSD）领域推文的百分比0平均压力值0TensiStrength的皮尔逊相关系数（不包括WSD）0TensiStrength的皮尔逊相关系数（包括WSD）0学术 10% -3 0.356 0.4120商业 7% -3 0.422 0.455 气候 11% -3 0.485 0.512 娱乐8% -2 0.487 0.5230食品 6% -1 0.365 0.376 健康 9% -3 0.418 0.452 个人18% -3 0.501 0.532 政治 11% -4 0.567 0.603 宗教 5%-4 0.574 0.631 运动 7% -3 0.452 0.597 旅行 8% -30.423 0.4820表9.TensiStrength在不同领域中的放松检测性能（包括和不包括WSD）领域推文的百分比平均放松值0TensiStrength的皮尔逊相关系数（不包括WSD）0TensiStrength的皮尔逊相关系数（包括WSD）0学术 7% 1 0.378 0.4250商业 7% 1 0.523 0.527 气候 11% 2 0.514 0.497 娱乐 8%2 0.390 0.4260食品 6% 2 0.590 0.653 健康 9% 2 0.623 0.671 个人 18%2 0.612 0.634 政治 14% 2 0.633 0.645 宗教 5% 1 0.5420.602 运动 7% 2 0.552 0.574 旅行 8% 2 0.587 0.69401.推文中最大的类别是个人事件、政治和气候类别。其余的推文几乎均匀分布在其他8个领域中。可以看出，WSD在所有领域的推文中都能持续改善TensiStrength算法的性能。性能的提升不限于任何单一领域。02.推文的压力值比放松值更高。在所有领域中，压力的平均值为-2.81，而放松的平均值为+1.72。这可能是因为压力是一种具有高唤醒度的情绪状态，而放松则具有低唤醒度。从这个意义上说，压力是一种更强烈的情绪状态，因此更有可能引发推文等反应。03.政治和宗教的推文压力值较高（-4），而食品和娱乐是压力值最低的领域（分别为-1和-2）。这与从领域中预期的压力值的直觉一致。05 结论和未来工作0在这项研究工作中，我们将WSD解决方案作为现有基于词典的紧张/放松方法的预处理阶段进行了实现。我们收集了包含1000条具有歧义情感词的推文数据集，并进行了高度一致的注释。结果发现，引入WSD可以显著提高TensiStrength在皮尔逊相关系数和精确匹配百分比方面的性能，无论是在紧张还是放松方面。带有WSD的TensiStrength的性能也优于机器学习方法。鉴于测试集的相对较小，需要使用更大的带有紧张和放松强度注释的数据集进行进一步研究。我们计划的下一步是分析推文中表达的紧张和放松的原因（即，压力因素和放松因素）。在文献综述中，发现这是一个很大程度上未被探索的研究领域。我们制定了一个新颖的框架，用于在政治、体育、交通和个人事件等各种领域中找到压力因素和放松因素。该框架主要包括两个模块：分类器和原因查找器。我们计划在第一个模块中使用机器学习分类器，将推文标记为广泛的主题类别，例如政治、体育、娱乐、个人事件、健康、气候和交通，如结果部分所列。每个类别都有一个相关潜在压力因素和放松因素的列表，作为研究的一部分进行手动编制。因此，表达的压力和放松的原因被缩小到该列表中的一个。原因查找器模块使用单词向量表示从该列表中找到实际原因。它从推文中消除了冗余词，如介词、连词、感叹词和冠词，并从剩余词中构建了一组关键词。该集合中每个词的向量与相关类别中的每个潜在压力因素/放松因素的余弦相似度。在推文中，与任何关键词的余弦相似度最高的向量所代表的压力因素/放松因素被选择为推文中的压力/放松原因。我们使用了一小组推文的试验来验证这种方法的可行性，目前正在编制完整的数据集并进行进一步的实验。因此，这项研究工作通过提高准确性和提出识别压力和放松的自动检测方法，为自动检测压力和放松做出了贡献。0会议：第六届自然语言处理社交媒体国际研讨会 WWW 2018，2018年4月23日至27日，法国里昂 16840提出了一个用于识别压力和放松的因果因素的新框架。未来，这可能取代或补充传统的压力/放松检测方法，并有助于改进诸如医疗保健、交通管理或客户服务等应用和服务。这是朝着利用网络和特别是社交媒体数据的更大目标迈出的有希望的一步。致谢：本研究得到了欧盟Horizon2020研究和创新计划在636160-2号授权下的支持，Optimum项目www.optimumproject.eu。0参考文献0[1] Mike Thelwall. 2017.TensiStrength:社交媒体文本的压力和放松程度检测。信息处理与管理杂志。（2017）;53：106-121 [2] Hans Selye. 1956. 生活的压力。纽约，麦格劳-希尔图书公司。[3] J.Choi和R.Gutierrez-Osuna。使用心率监测仪检测心理压力，第6届国际研讨会可穿戴植入式BSN，第219-223页，2009年。[4] Y. Shi，N. Ruiz，R. Taib，E. Choi和F. Chen。2007.“皮肤电反应（GSR）作为认知负荷的指标”，CHI Ext.Abstr.人因计算机系统，第2651-2656页。[5] P. Ren，A. Barreto，J. Huang，Y.Gao，F.R. Ortega和M.Adjouadi。2014.通过处理瞳孔直径信号进行离线和在线压力检测。Ann. Biomed.Eng.，42（1）第162-176页，10.1007/s10439-013-0880-9 [6] F. Kittel，M.Kornitzer和M. Dramaix。1986.。评估A型人格。研究生医学杂志62（730）：781-3。[7]T.H. Holmes和R. H.Rahe。1967.社交重新适应评分量表。心理身体研究杂志，爱思唯尔[8] R.Kotikalapudi，S. Chellappan，F.Montgomery。2012.将互联网使用与大学生的抑郁行为相关联。IEEE技术社会杂志；31：73-80。[9] M. A. Moreno，L. A. Jelenchick，K. G. Egan，E. Cox，H. Young，K. E.Gannon等。2011.在Facebook上感到不好：大学生在社交网络网站上的抑郁披露。抑郁和焦虑，28（6），447-455。[10] M. De Choudhury，M. Gamon，S. Counts和E.Horvitz。2013.通过社交媒体预测抑郁症。在国际AAAI博客和社交媒体会议（ICWSM）的论文集中。[11] G. A. Coppersmith，C. T. Harman和M.Dredze。2014.在Twitter上测量创伤后应激障碍。在国际AAAI博客和社交媒体会议（ICWSM）的论文集中。[12] M. De Choudhury，S. Counts和E.Horvitz。2013.社交媒体作为人群抑郁症测量工具。在第五届年度ACM网络科学会议（WebSci '13）的论文集中，47-56。DOI = http：//dx.doi.org/10.1145/2464464。[13] M.De Choudhury，S. Counts和E.Horvitz。2013.通过社交媒体预测产后情绪和行为变化。在ACM人因计算机系统年会（CHI）的论文集中，3267-3276。[14] G. Coppersmith，M. Dredze，C.Harman。2014.在Twitter中量化心理健康信号。在：计算语言学和临床心理学研讨会论文集。ACL；2014年。第51-60页。[15] Y. R. Tausczik和J. W.Pennebaker，2010.单词的心理意义：LIWC和计算机化文本分析方法。语言和社会心理学杂志，29（1），24-54。[16] P. J. Stone，D. C. Dunphy，M. S. Smith和D. M.Ogilvie。1966.普通研究者：内容分析的计算机方法。剑桥，MA：麻省理工学院出版社。[17] M. Thelwall，K. Buckley G. Paltoglou，D. Cai和A.Kappas。2010.短暂非正式文本中的情感强度检测。美国信息科学与技术学会杂志，61（12），2544-2558。0[18] H. Lin, J. Jia, J. J. Qiu等. 2017. 基于社交网络中社交互动的压力检测.IEEE知识与数据工程交易. [19] H. Lin, J. Jia, J. Huang等. 2016. Moodee:一种智能移动伴侣, 通过社交媒体发布检测您的压力. 第30届AAAI人工智能大会. [20] H.Lin, J. Jia, J. Huang等. 2014. 使用深度稀疏神经网络从跨媒体微博数据中检测心理压力.在IEEE国际多媒体与博览会会议记录中. [21] H. Lin, J. Jia, J. Huang等. 2014.使用深度神经网络从社交媒体中检测用户级心理压力. 在

下载后可阅读完整内容，剩余1页未读，立即下载