检测推文中压力和放松的强度和因果因素

71 浏览量更新于2023-10-15 收藏 12.78MB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

8370检测推文中压力和放松的强度和因果因素0Reshmi Gopalakrishna Pillai0由迈克∙塞尔沃尔教授和康斯坦丁∙奥拉桑博士指导0信息与语言0英国伍尔弗汉普顿大学0reshmi.g85@gmail.com0摘要：0及时诊断与压力相关的疾病，确保服务中的客户满意度，并管理以人为中心的应用程序，如交通管理，对于检测人类压力和放松至关重要。传统方法使用压力测量量表或生理监测，这可能是侵入性和不方便的。相反，社交媒体的普遍性质可以用来识别压力和放松。在这个博士研究中，我们介绍了一种改进的方法来检测社交媒体内容中的压力和放松表达。它使用词义向量进行词义消歧，以提高基于词典的压力/放松检测算法TensiStrength的性能。实验结果表明，具有词义消歧的TensiStrength在Pearson相关系数和准确性方面优于原始的TensiStrength和最先进的机器学习方法。我们还提出了一种基于词向量的新颖方法，用于检测社交媒体内容中压力和放松的原因。0CCS概念：0• 信息系统 → 信息检索 → 检索任务和目标 → 情感分析 •人类中心计算 → 协作和社交计算 → 社交媒体 • 计算方法学 →人工智能 → 自然语言处理0关键词：0压力；社交媒体；Twitter；情感分析；词义消歧；词向量0ACM参考格式：0R. Gopalakrishna Pillai. 2018. Detection of Stress and Causal Agents ofStress and Relaxation for Tweets. In The 2018 Web ConferenceCompanion (WWW’18 Companion), April 23-27, 2018, Lyon, France,ACM, New York, NY, 5 pages. DOI:https://doi.org/10.1145/3184558.31865720本文发表在知识共享署名4.0国际许可证（CC-BY4.0）下。作者保留在个人和公司网站上传播作品的权利，并附上适当的归属。WWW 2018，2018年4月23日至27日，法国里昂。©2018IW3C2（国际万维网会议委员会），根据知识共享CC BY4.0许可证发布。ACM ISBN 978-1-4503-5639-8/18/04.. DOIhttps://doi.org/10.1145/3184558.318657201 问题0在健康领域，识别社交媒体文本中的压力能够作为诊断健康相关疾病的工具，帮助以客户为中心的企业检测不愉快的体验（例如旅游），以及管理大规模人类的系统（例如交通、人群管理）。早期发现压力可以帮助及早采取行动以避免情况升级。根据上下文，这些行动可能包括推荐压力相关疾病的医疗咨询（或提供此类咨询的证据），更改酒店运营程序以避免客户压力聚集点，将压力的客户重新路由到人工坐席而不是自动电话坐席，或触发紧急交通管理措施。同样，了解放松的程度和原因也很重要，作为压力的相反情感状态和应用和服务内容的指标。0从社交媒体内容中检测压力和放松一直是一个很少被探索的研究领域。这个博士研究涉及与社交媒体中表达的压力和放松相关的两个独立任务：第一个任务在Twitter上实现了基于词向量的词义消歧方法，以提高基于词典的压力/放松检测TensiStrength[1]的性能。在第二个任务中，我们提出了一个框架，利用词向量来找到推文中压力和放松的因果因素（在本文中后文称为压力因素和放松因素）。0本研究的贡献如下：01. 首次将WSD与压力/放松检测结合。02.一个更新的压力/放松得分词典，适应压力/放松词义的多义性。03.我们提出了一种新颖的方法，用于找出社交媒体内容中表达的压力和放松的原因。据我们所知，这是首次尝试在政治、体育等不同领域的推文中找出压力和放松的原因。02018年4月23日至27日，法国里昂，WWW 2018博士生论坛 83802 现有技术0虽然自动化的压力/放松检测相对较新，但它与情感分析中的其他情感任务密切相关，例如极性或细粒度情绪。02.1 压力和放松的识别0来自社交媒体内容0TensiStrength是第一个用于检测推文中表达的压力和放松强度的系统。它主要是一种词汇方法。词典部分来源于LIWC[2]、GeneralInquirer[3]和SentiStrength[4]中的情感词。在原始评估中，对3066条英文推文进行了人工编码，以五点量表对压力和放松进行评分：-1表示没有压力，-5表示最高压力；+1表示没有放松，+5表示最高放松。它的性能与支持向量机等机器学习算法相似。0[5]中提出的混合系统结合了因子图模型和卷积神经网络（CNN），建立了用户心理压力水平与其社交网络互动之间的关系。这种方法在F1分数方面将压力检测提高了6-9%。0[6]中描述的系统可以识别社交媒体文本中的压力。它使用压力事件类别和压力主题以及与每个类别和主题相似的一组词基于词嵌入。压力事件和主题使用将多任务学习与CNN相结合的新型混合模型来识别。推文根据社交再适应评分量表[7]被分配一个压力值。以这种方式获得的压力得分与一些最先进的机器学习模型相当。0虽然这项工作是寻找压力和放松原因的先驱性研究，但其兴趣范围仅限于个人事件，如离婚、死亡和分娩。相反，我们的研究分析了表达短期和长期压力和放松的推文，涉及各种情境，如交通、政治、个人事件和学术界。02.2 情感分析中的词义消歧0检测压力或任何情感状态的表达的一个重要挑战是社交媒体文本使用非标准语法和非正式语言元素。情感词可能是模棱两可的，它们的意义会根据上下文而改变。例如，在“那位女士对他投以冷漠的目光”中，情感词“冷漠”表示压力，而在“我对事情很冷静”中，它表示放松。解决这个词的意义对于正确识别压力是必不可少的。自然语言处理任务中的WSD（词义消歧）以计算方式在上下文中识别单词的意义[8]，是对这个问题的传统回应。0使用Babelfy和SentiWordNet的WSD系统[9]说明了它如何提高Twitter和短信测试数据中情感检测的准确性指标。Babelfy是一种多语言基于图的词义消歧方法。该系统的准确性（58.55%）比基线方法（45.26%）更高。用于对比喻语言进行情感分析的基于图的WSD方法[10]在召回率和精确度方面显著优于没有WSD的极性检测方法和基线WSD（将WordNet的第一个词义条目分配给所有词义）。0另一项研究[11]将使用扩展的词义重叠描述的WSD算法与基于SentiWordNet的文本极性分类器VoxPop[13]集成，将准确性从50.5%提高到60.0%。尽管在方法和词汇资源上有所不同，但所有这些研究都表明，具有WSD的情感分析系统的性能远远优于没有WSD的系统。我们的研究将WSD视为提高现有词汇方法准确性的一种潜在方法。02.3 单词向量表示及其在词义消歧中的应用0用于WSD的标准自然语言处理方法基于标准语法和拼写，这在社交网络中并不常见。用于非正式文本的WSD的一种有希望的方法是将单词表示为实值向量，记录其上下文单词（例如，在同一句子中）的频率。这可以与单词不同意义的类似聚合向量进行比较，并使用最接近的匹配向量选择最可能的词义。GloVe是一种无监督学习算法[14]，Word2Vec[15,16]是用于找到单词向量表示的两种最常见的架构。Word2Vec使用两种模型（词袋和Skip-gram）中的连续向量表示单词。在词袋模型中，目标是在给定输入上下文词的情况下预测中心词，而Skip-gram模型的输入向量是焦点词，目标是预测上下文词。GloVe模型旨在将Skip-gram模型的优点与使用矩阵分解方法的单词共现的全局统计信息相结合。0Sense2Vec[17]是一种监督式的意义嵌入系统，可以根据上下文区分同一个词的不同意义。类似地，从基于Skip-gram的单词向量和WordNet词汇解释中获得的意义向量方案已被提出用于WSD[18]。本文提出的算法分为两个步骤：初始化单词和意义向量以及WSD。在第一步中，通过Skip-gram模型学习单词向量，并从中构建每个意义的意义向量。对于词汇中的每个单词，计算与原始单词的余弦相似度。那些与阈值以上的余弦相似度的单词被添加到候选集中。候选词的向量的平均值被视为意义向量。0在词消歧的第二步中，给定一个句子，通过找到内容词向量的平均值来计算初始上下文向量。与上下文向量具有最高余弦相似度的意义被视为消歧结果。0PhD Track WWW 2018，2018年4月23日至27日，法国里昂 cool_2 +3 (aplomb, assuredness, cool, poise, sangfroid) cool_9 -2 (unfriendly or unresponsive or showing dislike) 8390结果。我们在当前实验中使用了基于词向量的这种意义消歧方法。03 提出的方法0该研究试图找出以下两个研究问题的答案：01.使用WSD是否可以提高从社交媒体内容中检测心理压力或放松强度的准确性？02. 我们能否从社交媒体内容中检测到压力和放松的原因？03.1 提高TensiStrength的准确性0通过结合基于词向量的WSD解决方案（最初在[18]中提出）来改进现有的TensiStrength方法。修改后的TensiStrength的准确性与没有WSD和最先进的机器学习算法相比，显著提高。03.2 在推文中找出压力和放松的原因的一种新方法0提出的方法将查找压力源和放松源的任务分为两个部分：查找推文的类别/领域和词向量处理以找到确切的压力源/放松源。04.1 提高TensiStrength的准确性0该方法包括以下步骤：04.1.1文献综述。研究了以下方面的现有文献：WSD以及它如何提高社交媒体内容情感检测的准确性，词向量在WSD任务中的使用，从社交媒体内容中检测压力/放松。04.1.2 使用示例推文的工作流程。要处理的示例推文是“The ladygave me a coolstare”。经典版本的TensiStrength将识别情感词'cool'并将其分配给该推文的放松强度+2。然而，人类编码者将能够消除'cool'的歧义并将其正确地分配给压力强度-2。在修改后的TensiStrength中（如图1所示），预处理步骤首先找出词在WordNet中的可能意义列表中的哪个意义在此上下文中使用。将具有正确消除歧义情感词的预处理推文进一步提供给基于词典的压力/放松强度检测方法，现在可以正确地将该推文标识为表示压力，而不是放松。04.1.3扩展TensiStrength词典以纳入情感词的歧义。我们手动更新了TensiStrength词典，以适应40个模糊词的不同意义的压力/放松值。例如，以下是'cool'的词典条目。0图2.使用修改后的TensiStrength算法（带有WSD）处理推文的工作流程。没有WSD的TensiStrength只有一个关于情感词'cool'的条目，表示中等放松的+2。但是修改后的词典承认了来自WordNet的同一个词的不同意义。例如，WordNet中'cool'的第九个意义是'不友好或表现出不喜欢'，它具有压力的指示，因此被赋予值-2。同样，其他意义也被赋予适当的压力/放松值。WordNet中的意义序号用作原始词的后缀。以下是词典的一些示例添加。意义的解释在括号中给出。04.1.4数据集。在一个月的时间内（从2017年2月1日到2017年3月1日），收集了一千条带有模糊情感词（例如cool）的推文作为实验的数据集。这些推文由三名人类编码者独立进行注释，使用五分制对其进行压力和放松程度的评分。编码者们在TensiStrength实验中参与了相同的注释过程，因此他们在压力/放松强度注释任务上有先前的经验。这些推文根据压力和放松强度进行注释，分数范围从+1到+5（+1表示没有放松，+5表示非常高的放松），从-1到-5（-1表示没有压力，-5表示非常高的压力）。计算了三个编码者注释分数的算术平均值，并四舍五入到最接近的整数值。这被视为压力和放松值的黄金标准。使用Krippendorff的α计算了每对编码者之间的一致性。Krippendorff建议α的最低可行限制>0.667。三个编码者在压力（0.778）和放松（0.781）方面的整体一致性被认为足够高。表1显示了压力值注释的编码者之间的一致性。方法A和B，B和C，A和C。0Krippendorff的α 0.774 0.781 0.7710皮尔逊相关系数 0.796 0.814 0.7920表2. 放松注释的编码者间一致性方法 A和B B和C A和C0Krippendorff的α 0.751 0.802 0.7810皮尔逊相关系数 0.796 0.820 0.7970随后实验中的更高一致性值表示编码者在注释方面的一致性越来越好0PhD Track WWW 2018，2018年4月23日至27日，法国里昂 0.4735 48.8112 83.2367 0.5443 53.1091 92.4137 8400任务。它还表明问题陈述和注释说明非常明确。4.1.5实验。使用在400万条推文上训练的TwitterWord2Vec模型，该模型作为ACLW-NUT任务的一部分发布，用于训练此实验的单词和词义向量。基于[11]中提出的方法实现了基于WSD的模块，使用AnacondaPython包作为我们研究工作的一部分，以评估其在应激和放松强度检测方面的改进。04.2 在推文中找到应激和放松的因果因素04.2.1文献综述。研究了以下方面的现有文献：社交媒体内容的应激/放松检测，推文的领域分类。04.2.2. 提出的框架的制定0图2. 找到应激因素和放松因素的框架我们制定了一个用于在推文中找到应激因素和放松因素的框架。该框架主要包括两个模块：1）分类器和2）原因查找器。第一个模块使用机器学习分类器将推文标记为政治、体育、娱乐、个人事件、健康、气候和交通等广泛的主题类别。每个类别都有一系列相关的潜在应激因素和放松因素。因此，表达应激和放松的原因被缩小到该列表中的一个。原因查找器模块使用单词向量表示找到该列表中的实际原因。它从推文中消除了介词、连词、感叹词和冠词等冗余词，并从剩余词中构建了一组关键词。计算表示该集合中每个词与相关类别中每个潜在应激因素/放松因素的向量的余弦相似度。与推文中任何关键词的余弦相似度最高的向量表示的应激因素/放松因素词被选择为推文中应激/放松的原因。4.2.3.实施。为了说明这种方法，我们分析了样本推文““Make nomistakes about it, this is no usual social media noise. We shallshout. We shallmarch.”，该推文被TensiStrength评分为-3（高应激）和+1（无放松）。我们使用机器学习分类器将此推文分类为“政治”广泛类别。属于政治类别的潜在应激因素列表为S ={'选举'，'抗议'，'骗局'，'演讲'}。接下来，通过消除所有冗余词语创建关键词集。关键词集为K ={'make'，'mistakes'，'usual'，'social'，'media'，'noise'，'shout'，'march'}。对于这两个集合的交叉乘积中的每一对词，计算余弦相似度。具有最高余弦相似度的一对中的第一个元素被选择为应激因素。使用在400万条推文上训练的TwitterWord2Vec模型，该模型作为ACL W-NUT任务的一部分发布。0[19]中，潜在应激因素和关键词之间的余弦相似度如下：0表3. 应激因素和关键词之间的余弦相似度选举抗议骗局演讲0Make 0.1045 0.1585 0.1629 0.09120错误 0.1439 0.0835 0.1752 0.15100Usual 0.1601 0.1592 0.0871 0.14110社交 0.1793 0.2431 0.1946 0.19690Media 0.3904 0.3073 0.2310 0.24510噪音 0.1442 0.2111 0.1730 0.20700Shout 0.0123 0.2305 0.1528 0.261203月 0.3034 0.4502 0.1719 0.24740这里，具有最高余弦相似度（0.4502）的应激因素-关键词对是（Protest，March）。因此，“Politics”类别中的“Protest”被选择为推文“Make no mistakes about it, this is no usual social medianoise. We shall shout. We shallmarch.”的应激因素。这个试验验证了这种方法的可行性。我们正在构建一个数据集，该数据集是一组带有类别和应激/放松原因注释的推文，以评估该方法的性能。未来的研究将包括在该数据集上评估所提出的框架并编制结果。05 结果 5.1 提高推文中应激和放松检测的准确性使用TensiStrength与WSD进行推文中应激和放松检测的准确性与不进行WSD预处理阶段的TensiStrength以及一系列标准机器学习算法进行了比较：自适应增强算法（AdaBoost）、朴素贝叶斯分类器（Bayes）、分类树（J48Tree）、逻辑回归（Logistic）和支持向量机（SVM）。使用Unigrams、Bigrams和Trigrams作为特征。每个分类器都使用Weka3.6中的配置进行实现。根据与人工标注数据的皮尔逊相关系数和精确匹配百分比，发现使用预处理阶段来消除词义歧义的TensiStrength明显优于最先进的机器学习算法和没有预处理的TensiStrength。结果总结如下表所示：表4. 应激检测结果方法皮尔逊相关系数0精确匹配百分比0匹配百分比（在1之内）0AdaBoost 0.3543 30.1671 83.15620Bayes 0.3238 35.3464 90.18240J48 Tree 0.4649 47.4562 88.35430Logistic 0.4948 49.2679 89.21670SVM 0.5124 51.2543 91.56260TensiStrength没有WSD0TensiStrength与WSD0PhD Track WWW 2018，2018年4月23日至27日，法国里昂 0.5304 56.3878 85.8364 0.56441 60.6981 93.1227 8410表5. 放松检测结果方法皮尔逊相关系数0精确匹配百分比0匹配百分比0（在1之内）0AdaBoost 0.3254 34.1335 83.54510Bayes 0.3577 38.9221 84.67350J48 Tree 0.5224 51.5634 86.17340Logistic 0.4987 54.3267 89.17980SVM 0.5546 58.7324 91.65980TensiStrength没有WSD0TensiStrength与WSD0TensiStrength与WSD阶段相比，表现明显优于没有WSD的TensiStrength和机器学习方法。然而，标注数据集（以及训练数据）的规模较小可能是机器学习方法相对较差表现的主要原因。更多推文的结果可能更好地证明TensiStrength与WSD相比标准机器学习方法在应激和放松检测方法上的卓越效果。此外，当前数据集中的推文包含添加到TensiStrength词典中的模棱两可的词语。在随机选择的一组推文上的性能可能会有所不同。 6 结论和未来工作作为博士研究的一部分，我们解决了两个研究问题。首先，我们将WSD解决方案实现为现有基于词典的应激/放松方法的预处理阶段。发现在皮尔逊相关系数和精确匹配百分比方面，将WSD纳入TensiStrength显著提高了其在应激和放松方面的性能。TensiStrength与WSD的性能也优于机器学习方法，但需要使用标注有应激和放松强度的更大数据集进行进一步研究。第二个研究问题是找出社交媒体中应激和放松的原因。我们提出了一个新颖的框架，用于在政治、体育、交通和个人事件等各种领域中找到应激因素和放松因素。我们成功地进行了试验验证了这种方法的可行性。在未来，这种研究工作中开发的自动方法有望取代或补充传统的应激/放松检测方法，并有助于改进的应用和服务，如医疗保健、交通管理或客户关怀。这是朝着利用Web和特别是社交媒体数据的更大目标迈出的有希望的一步。0参考文献0[1] Thelwall, M. TensiStrength: 社交媒体文本中压力和放松程度检测.《信息处理与管理杂志》2017; 53: 106–1210[2] Tausczik, Y. R. and Pennebaker, J. W. 2010. 词语的心理意义:LIWC和计算机化文本分析方法. 《语言与社会心理学杂志》, 29(1), 24-540[3] Stone, P. J., Dunphy, D. C., Smith, M. S., and Ogilvie, D. M. 1966. 一般查询器:内容分析的计算机方法. 麻省理工学院出版社0[4] Thelwall, M., Buckley, K., Paltoglou, G. Cai, D., and Kappas, A. 2010.短非正式文本中的情感强度检测. 《美国信息科学与技术学会杂志》, 61(12), 2544–25580[5] Lin, H., Jia, J., Qiu, J., 等. 基于社交网络中的社交互动检测压力. 2017年.《IEEE知识与数据工程交易》0[6] Lin, H., Jia, J., Nie, L., Shen, G., and Chua, T.S. 2016.社交媒体对你的压力有何说法？《第25届国际人工智能联合会议论文集》, 3775–37810[7] Holmes, T.H., and Rahe, R.H. 1967. 社会重新适应评分量表. 《心身研究杂志》,11(2):213–2180[8] Navigli, R. 2009. 词义消歧: 一项调查. 《ACM计算调查》, 41(2009), 1-690[9] Sumanth, C., and Inkpen, D. 2015.词义消歧对微博数据情感分析有多大帮助？《主观性、情感和社交媒体分析的第6届研讨会论文集》, 115-121, 里斯本0[10] Rentoumi, V., Giannakopoulos, G., Karkaletsis, V., and Vouros, G. 2009.使用词义消歧方法对比喻语言进行情感分析. 《国际会议RANLP'09论文集》, 页码370-375,保罗韦茨, 保加利亚0[11] Razon, B., and Cheng, C., 使用扩展的词汇重叠进行带有观点的词义消歧.2011年《第8届国家自然语言处理研究研讨会论文集》, 1-5, 马尼拉0[12] Banerjee, S., and Peterson, T. 2003. 扩展的词汇重叠作为语义相关性的度量.《第18届国际人工智能联合会议论文集》, 802-810, 墨西哥0[13] Bautista, G.Z., Garcia, M.A., and Tan, R.J. 2010. VoxPop:基于数据聚类的自动化意见检测和分类. 马尼拉0[14] Pennington, J., Socher, R., and Manning, C.D. 2014. Glove: 用于词表示的全局向量.《2014年自然语言处理会议论文集》(2014年10月), 1532-15430[15] Mikolov, T., Chen, K., Corrado, G., and Dean, J. 2013.高效估计词向量空间中的词表示. arXiv预印本 arXiv:1301.3781, 1-120[16] Mikolov, T., Sutskever, I., Chen, K., Corrado, G., and Dean, J. 2013.词的分布式表示, 神经信息处理系统进展, 3111-31190[17] Trask, A., P. Michalak, and J. Liu.sense2vec-一种在神经词嵌入中进行词义消歧的快速准确方法. arXiv预印本 arXiv:1511.06388, 2015年0[18] Chen, X., Liu, Z., and Sun, M. 2014. 词义表示和消歧的统一模型.《EMNLP》.1025–10350[19] Godin, F., Vandersmissen, B., De Neve, W., and Van de Walle R. 2015.使用分布式词表示进行Twitter微博的命名实体识别. 《嘈杂用户生成的文本研讨会论文集》,页码146-153, 中国北京, 2015年7月. 计算语言学协会01.这项博士研究由英国伍尔弗汉普顿大学信息与语言处理研究所的Mike Thelwall教授和Constantin Orasan博士指导。02018年4月23日至27日，法国里昂举办的博士生研讨会WWW 2018

下载后可阅读完整内容，剩余1页未读，立即下载

cpongm

粉丝: 5
资源: 2万+

检测推文中压力和放松的强度和因果因素

磁场强度和磁感应强度的因果关系

格兰杰因果检测故障检测

用格兰杰因果检验脑区的节点之间是否有因果关系，并将因果强度进行排序，用pytorch来实现怎么实现

软件测试中条件是否选项怎样换成因果图

上述问题的因果图怎么画

在HIL测试中，使用因果图法举例说明一条测试用例

什么是黑盒测试的因果图法

区分因果关系和相关关系

梁氏因果分析python

软件测试流程_软件测试流程设计(3)：因果图法

队列数据如何建立因果推断模型

因果图法设计三角形测试用例

数据分析中，人货匹配的因果推断

预约投保 试用因果图法为该程序设计测试用例

非线性双变量因果方向比率

因果图方法设计测试用例

dematel因果关系图的绘制python

经济学中的逆向因果如何解决

因果论模型推理推断pdf

_Command_line_settings_desktop_wallpaper_tool,_Su_command-wallpa

最新资源

预约投保试用因果图法为该程序设计测试用例