孟加拉国社交媒体上对COVID-19疫苗接种情绪的情感和极性分析【2022年】

103 浏览量更新于2023-12-06 收藏 2.28MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

阵列15（2022）100204分析社交媒体上对COVID-19疫苗接种的公众情绪：孟加拉国背景马里兰州Sabab Zulfikera，*，Nasrin Kabirb，Al Amin Biswas a，Sunjare Zulfiker c，Mohammad Shorif Uddinb/a孟加拉国达卡水仙国际大学计算机科学与工程系b孟加拉国达卡贾汉吉尔纳加尔大学计算机科学与工程系c孟加拉国达卡南北大学电子和计算机工程系A R T I C L EI N FO保留字：COVID-19疫苗接种公众情绪社交媒体传统机器学习A B S T R A C T自二零一九年十二月以来，全球一直在抗击COVID-19疫情。这场流行病揭示了一个痛苦的事实，即尽管人类在过去几十年中在技术方面取得了前所未有的进步，但在医学和保健领域却远远落后。一些研究所和研究组织已加紧引进不同的疫苗来防治这一流行病。孟加拉国政府还采取措施，从2021年1月起提供广泛的疫苗接种。孟加拉网民经常在Facebook、Twitter等不同社交媒体网站上分享他们对COVID-19疫苗和疫苗接种过程的想法、情感和经历。为了进行这项研究，收集了孟加拉国网民在社交媒体上的反应。潜在狄利克雷分配（LDA）模型已被用来提取最常见的主题表达的网民对疫苗和疫苗接种过程中在孟加拉国。最后，本研究应用了不同的深度学习以及传统的机器学习算法来识别网民意见的情感和极性。这些模型的性能已经使用各种指标进行了评估，如准确性，精密度，灵敏度，特异性和F1评分，以确定最佳的一个。从这些意见中得出的情绪分析教训可以帮助政府为未来的大流行做好准备1. 介绍世界卫生组织（WHO）宣布COVID-19为2020年1月，大流行[1]。COVID-19对世界各地人民的日常生活造成重大影响。据报道，截至2022年1月，COVID-19已影响超过3.8亿人，超过568万人死亡[2]。孟加拉国是世界上人口最稠密的国家由于人口众多，它是这一流行病的最严重受害者之一截至2022年1月，孟加拉国有超过180万例COVID-19确诊病例，超过28，000人死亡[3]。各种健康预防措施，例如保持社交距离，戴口罩，以及保持适当的卫生措施等，都是预防禽流感的必要措施。然而，仅仅采取适当的卫生预防措施不足以从地球上消除这一流行病。接种疫苗是唯一的方法来阻止这种疾病的传播。美国、中国、俄罗斯等国已经开始生产疫苗。发达国家正在进行大规模疫苗接种。孟加拉国政府也已采取措施，从2021年初开始接种疫苗。截至2022年1月，累计接种疫苗超过1.6亿剂次，超过6200万人完成全面接种[3]。使用社交媒体的人数随着使用互联网的人数的增加而增加。近年来，不同的社交媒体平台已经成为互联网用户表达情感和反应的主要手段[4]。超过20亿人经常通过社交媒体平台分享他们的日常活动[5]。根据一项研究，目前全球有35亿互联网用户。世界上每三个人中就有一个人使用不同的社交媒体网站。一些最受欢迎的平台是Facebook，Twitter和YouTube。到2019年，* 通讯作者。电子邮件地址：sabab.rumc@ gmail.com（马里兰州）Zulfiker），etykabir16@gmail.com（N.Kabir），alaminbiswas. gmail.com（A.A.Biswas），sunjare.gmail.com（S. Zulfiker），shorifuddin@gmail.com（M.S.Uddin）。https://doi.org/10.1016/j.array.2022.100204接收日期：2022年3月28日;接收日期：2022年5月31日;接受日期：2022年6月3日2022年6月12日在线提供2590-0056/© 2022作者。爱思唯尔公司出版这是一篇基于CC BY-NC-ND许可证（http://creativecommons.org/licenses/by-nc-nd/4.0/）的开放获取文章。可在ScienceDirect上获得目录列表阵列期刊主页：www.sciencedirect.com/journal/array医学博士Zulfiker等人阵列15（2022）1002042Facebook用户、3.3亿Twitter用户和超过19亿You- Tube用户[6]。由于这些社交媒体网站的简单性，用户非常依赖这些平台来分享新闻和信息。这些平台也成为健康相关信息的主要来源。在当前COVID-19形势下，人们正在广泛分享和讨论他们对大流行、疫苗和疫苗接种过程的看法。用户发布积极和消极的新闻和意见。有时，关于疫苗和疫苗接种过程的负面和虚假信息会造成疫苗犹豫，导致个人对接种疫苗不感兴趣。2019年，疫苗犹豫被列为对全球健康的十大影响之一[7]。关于疫苗接种程序的虚假和误导性信息，降低一个国家疫苗接种率的能力。随着孟加拉国COVID-19疫苗接种计划的开始，孟加拉国网民也在使用社交网络平台表达他们的观点和反应。他们对正在进行的疫苗接种计划反应不一。然而，很少有研究分析孟加拉国网民对COVID-19疫苗接种计划的意见和感受。本书试图填补这一空白。根据不同的人口统计属性，这项研究考察了社交媒体用户对新冠疫苗和孟加拉国正在进行的疫苗接种活动的感受。本研究还旨在提取孟加拉国网民对这些运动表达的最重要的主题。最后，本研究提出了几种机器学习和深度学习方法用于评估社交媒体用户对孟加拉国疫苗接种计划的看法的极性，并选择了能够准确识别用户情绪极性的最佳模型。通过利用本研究中描述的方法和途径，孟加拉国政府和决策者可以了解孟加拉国居民对正在进行的疫苗接种运动的实际意见和情绪。他们可以了解到公民对这些运动提出的最关心的问题。根据这些信息，政府可以采取适当行动，确保孟加拉国人民获得足够的疫苗接种服务。政府也可以意识到孟加拉国公民对疫苗的普遍误解。通过分析这些误解，他们可以采取适当的举措，提高当地公民对这些谬论的认识。此外，从这些意见中吸取的教训可以帮助政府为未来的大流行做好准备。本研究的主要贡献如下：i. 构建孟加拉国关于COVID-19疫苗和疫苗接种活动的公众意见语料库。ii. 分析孟加拉国公民对疫苗接种和疫苗接种运动的看法。在社交媒体上表达的疫苗和疫苗接种过程有助于疾病监测、控制和最终根除。传染病的威胁对人们如何以各种方式感知和行动产生重大影响，因此这是一个复杂的问题。在这一部分中，我们查阅了各种高质量的相关研究，以了解每个研究的发现和局限性。Naseem等人[1]使用了一个包含9万条COVID-19相关推文的大型数据集来研究公众对这一流行病的态度。该研究旨在发现Twitter用户讨论的关于COVID-19疫情的最热门问题。LDA模型用于执行主题建模。采用不同的机器和基于深度学习的模型来预测极性公众对疫情的看法根据这项研究，双向编码器表示变压器（BERT）模型在分类公众情绪方面表现最好Chakraborty等人[8]进行了他们的研究，以分析极性公众对新型冠状病毒疫情的意见。根据这项研究，尽管人们在推特上大多数都是关于流行病的积极状态，但大多数转发都代表了负面情绪。作者提出了一个基于深度学习的模型来识别公众对疫情的情绪极性，准确率达到81%。他们还提出了一个基于高斯隶属函数的模糊模型来确定公众意见的极性。这样做，他们达到了79%的准确率Shim等人[9]收集了韩国关于COVID-19疫苗的公众意见。本研究利用LDA检索了韩国人群关于COVID-19疫苗讨论的最流行话题。为了识别公众对疫苗态度的极性，本研究提出了双向LSTM（Bi LSTM）模型。这项研究发现，最初，关于疫苗的正面和负面推文的比例几乎相同。然而，随着COVID-19感染病例的增加，有关疫苗的负面推文数量有所增加。在负面推文中，Twitter用户表达了他们对疫苗的恐惧和失望。菲律宾民众对菲律宾政府Villavicencio等人研究了COVID-19免疫接种工作[10]。本研究将情绪的极性分为三类，即积极、消极和中性。本研究使用朴素贝叶斯分类器来识别意见的极性，准确率为81.77%。Pristiyono等人也使用朴素贝叶斯分类器[11]来分析印度尼西亚公民对COVID-19疫苗的情绪。根据这项研究，关于疫苗的推文大多以负面情绪为主。Lyu et al. [12]进行了一项研究，以识别与COVID-19疫苗相关的社交媒体讨论中的情绪和主题。这项研究还试图检测随着时间的推移，关于疫苗的话题和情绪的变化。他们使用LDA进行主题建模，以及发送-iii. EX探索各种深学习和机器学习ap-对583，499条预测孟加拉国人口论文的其余部分安排如下：第二部分描述了研究的相关工作。分析孟加拉网民对COVID-19疫苗和正在进行的疫苗接种计划的意见的方法见第3节。研究结果见第4节。最后，第5节通过概述一些潜在的未来范围来总结本文。2. 相关作品毫无疑问，COVID-19已经对人类生命构成了极大的威胁。这一威胁也促使其疫苗的快速发展。另一方面，通过在线社交媒体传播的错误信息经常导致对疫苗的负面情绪和犹豫。了解人们对不同的人最后，他们发现，疫苗相关推文的主题建模产生了16个主题，这些主题被分为五个主题。然而，由于他们的数据集的时间，他们没有调查对个别疫苗品牌的情绪Kwok等人[13]利用机器学习（ML）算法提取Twitter上关于COVID-19免疫接种的情绪和主题。他们在收集了31,100条英文推文后，通过显示高频单词云和单词标记之间的关系来检查推文。他们构建了一个LDA主题模型，用于识别大量推文中的共同主题。他们的调查发现了三个问题。只有三分之一的推文显示了对COVID-19疫苗的负面想法，近三分之二的推文表示积极。在这项研究中发现的八种基本情绪中，最突出的两种积极情绪是信任和期待。Alam等人[14]进行了一项研究使用深度学习技术对疫苗接种的不同看法。医学博士Zulfiker等人阵列15（2022）1002043Fig. 1. 每月所收集意见的百分比。在这项研究中，使用自然语言处理（NLP）技术检查了人们对各种疫苗的态度，他们通过将所接收的感受的极性分为三类，即积极，消极和中性，来可视化场景。使用包括长短期记忆（LSTM）和双向LSTM（BiLSTM）的递归神经网络（RNN）来评估预测模型的性能。在这里，LSTM和Bi LSTM分别获得了90.59%和90.83%的准确度Hayawi等人[15]提出了一种独特的基于机器学习（ML）的COVID-19疫苗接种错误信息检测框架他们在收集和注释COVID-19疫苗推文后，使用ML技术对疫苗接种错误信息进行分类。他们将15，000多条推文分为两类，使用可靠的来源和专家的帮助这项研究工作使用了EX treme Gradient Boosting（XGBoost）、LSTM和BERT Transformer模型进行分类。在这些模型中，BERT模型表现出最好的性能。他们得出结论，基于机器学习的算法在检测COVID-19疫苗错误信息方面是成功的。Basiri等人[16]提出了一种独特的技术，通过结合不同的深度学习和传统的机器学习模型来分析来自八个国家的与冠状病毒相关的推文的情绪。他们还使用谷歌趋势来检查与冠状病毒相关的查询，以更好地了解情绪如何随着时间的推移而变化，不同的地点冠状病毒在不同时期和不同程度上引起了各国人民的强度，根据他们的结果。此外，他们的推文反映了他们对本国事件和新闻的态度，例如新感染病例、死亡人数和康复人数。此外，在整个感染传播过程中，在许多国家都注意到Nezhad和Deihimi [17]提出了一项研究，分析了伊朗使用波斯语推文表达人们对COVID-19疫苗接种的看法。首先，他们从Twitter上提取了803,278条波斯语推文，使用各种关键词来确定他们的情绪。为了分析推文的情感，他们利用了基于CNN-LSTM架构的深度学习模型结构。最后，他们发现对国产和进口疫苗的正面意见数量略有变化。研究表明，进口疫苗获得了大多数积极情绪。Melton等人[18]对从13个Reddit社区获得的文本数据进行了情感分析和LDA主题建模，这些社区专注于COVID-19疫苗接种。发现变化为了了解社区成员的意见，并确定社区成员意见的潜在主题，按月汇总和审查了数据。根据极性分析，这些社区对疫苗相关主题的积极情绪多于消极情绪。主题建模表明，社区成员更关心的是负面影响，而不是奇怪的阴谋论。在整个LDA主题建模过程中，发现了表明疫苗犹豫的关键词。Yang等人[19]调查了关于新冠肺炎大流行的误解和错误信息。他们将对COVID-19的误解分为五类。他们发现，大多数对新冠肺炎的误解都是针对病毒的传播。此外，他们还发现，关于病毒传播和预防方法的误解比其他类别传播得更快。他们采用了一种基于深度神经网络的模型来识别传播误解的推文的情绪。他们注意到，恐惧是这些推文中最普遍的情绪Zhou等人[20]探讨了抑郁症的动力学，澳大利亚一个州的公民在新冠肺炎大流行期间。根据这项研究，流行病增加了公民为了分析该州居民的抑郁症，他们从他们的推文中提取了多模态和词频逆文档频率（TF-IDF）特征来识别抑郁症在这些推文中，他们使用了不同的最先进的机器学习算法。Zhou et al. [21]还调查了公众对COVID-19疫情的意见动态。通过分析居民的推特在澳大利亚此外，他们还调查了民众他们采用了情感推理的配价意识词典（VADER）模型来分析情感的极性。Yin等人[22]进行了一项研究，以分析公众对Covid-19疫苗的态度。此外，他们还确定了最常见的问题，并讨论了与疫苗相关的主题。他们使用LDA进行主题建模，并使用VADER模型来确定感觉的极性。根据这项研究的结果，大多数网民表示愿意接种疫苗。这项研究还显示，网民对疫苗的不良影响、疫苗短缺和接种疫苗后死亡的消息有不良情绪。医学博士Zulfiker等人阵列15（2022）1002044表1评分者间可靠性测试分数。测试名称可靠性评分95%置信区间(95% CI）约束测试图二. 按帐户类型收集的意见的百分比。Yin等人[23]分析了社交网站上的话题和情绪的动态。他们发现，与居家隔离相关的推文大多传达了积极的观点，而讨论大流行导致死亡的推文大多表达了负面情绪。基于上述讨论，可以说，尚未进行任何研究工作，使用机器学习、深度学习和自然语言处理技术分析孟加拉国网民对疫苗和疫苗接种过程的意见。这项研究为填补这一空白铺平了道路。这项研究利用了不同的深度学习和传统的机器学习技术来识别孟加拉国网民意见的极性。此外，这项研究还提取了孟加拉国人在社交媒体上讨论的关于COVID-19疫苗的潜在话题，疫苗接种运动。3. 方法以下各小节涵盖提取孟加拉国网民讨论的最常见话题的整体策略，并使用各种深度学习和传统机器学习算法识别他们对COVID-19疫苗和疫苗接种计划的情绪极性。3.1. 数据收集为了进行这项研究，我们构建了一个数据集，其中包括孟加拉国网民的1075个状态，评论和推文。我们于二零二零年六月至二零二一年七月期间收集数据。用英语撰写的意见仅被考虑用于生成数据集。图1显示2020年6月至2021年7月收集意见的每月百分比。从图1的趋势可以看出，2020年人们不愿意表达他们对疫苗的看法和情绪。但从2021年1月开始，随着疫苗接种计划的启动图1表明，2021年5月获得的意见最多，2020年11月获得的意见最少。2021年5月收集的意见占总意见的25.30%，但另一方面，2020年11月收集的意见仅占总意见的0.65%。2021年5月，中国分阶段向孟加拉国无偿赠送疫苗。此外，孟加拉国一家制药公司主动在孟加拉国首次进口Moderna疫苗。网民们频繁地发表他们对这些事件的看法，导致社交媒体上的推文，状态更新和评论量激增。图2描绘了从组织和个人账户获得的意见的百分比。结果显示，16.65%的意见来自不同组织的账户，如新闻门户网站、健康组织等，83.35%的意见来自个人账户。组织账户包括儿童基金会孟加拉国办事处、儿童基金会南亚办事处、孟加拉国外交部以及《每日星报》、《达卡论坛报》等报纸的网页。3.2. 数据标签为了给陈述的极性贴上标签，我们雇佣了七名志愿者。志愿者将数据集的每个陈述的情绪分为两类：积极和消极。志愿者的多数评分被用来确定一个陈述的绝对极性。评分员间的可靠性评分为标签的声明是使用Krippendorf的Alpha [ 24 ]和Fleis的Kappa估计[25]可靠性测试。表1显示Krippendorf的α和Fleis的Kappa评分员间可靠性评分均大于0. 80。因此，可以说，志愿者协议的强度在给声明贴上标签已经足够了。在对7名志愿者进行多数投票后，595个状态被确定为具有积极极性。另一方面，480个陈述被发现有负面的极性。图3显示了每月正面和负面意见的百分比从图3中可以看出，除了2020年6月、2020年8月、2020年11月、2020年12月和2021年1月外，大多数月份具有积极极性的意见百分比大于消极极性的百分比。孟加拉国政府已于2021年1月最后一周启动疫苗接种计划。因此，孟加拉国网民对疫苗和疫苗接种计划的积极情绪在2021年1月后有所增加图4描绘了每十天的情绪动态。在疫苗接种运动之前，有很多关于疫苗的怀疑和负面意见。然而，在2021年1月之后，绝大多数公民对疫苗表达了积极的意见2021年3月，孟加拉国的受影响病例数量大幅增加因此，负面情绪百分比于二零二一年三月第一周后上升2021年4月中旬出现此外，自二零二一年六月底至七月中旬，负面情绪比率相当高。在此期间，该国也缺乏疫苗图5（a）和图5（b）分别显示了2021年正面和负面意见数量的10天移动平均值。在图5中，仅考虑了2021年1月至2021年7月的意见，因为收集的数据集中超过80%的意见来自这一时间段。图6（a）和图6（b）分别表示具有积极和消极情绪的意见的词云。3.3. 主题建模主题建模技术提取文本的潜在主题。它还将文档分组到已发现的主题和主题中。在这项研究中，潜在狄利克雷分配（LDA）模型，下界上KrippendorfFleis's0.84050.83400.85390.8600医学博士Zulfiker等人阵列15（2022）1002045≤ ≤-图3. 每月意见对立的百分比。图四、每十（10）天的情绪动态。已经被用来提取孟加拉国公民关于疫苗和疫苗接种过程中讨论最多的话题。2003年，Blei等人提出了LDA模型[26]。LDA将文档视为主题的集合。另一方面，主题被视为单词的混合。每个词出现在一个主题中的概率是衡量的。如果一个词在主题中出现的概率很高，那么包含该词的所有文档都与该主题紧密链接。本研究从孟加拉国网民关于疫苗和疫苗接种过程的正面陈述语料库和负面陈述语料库中提取了前五个主要主题。根据困惑度得分从积极和消极状态的语料中选出前五个流行话题。较低的困惑分数表明较高的概括能力。测量了前n个主题（2n5）的困惑得分。表2显示，前五个主导主题的困惑得分最低表3显示了包含LDA提取的肯定陈述的语料库中前五个主题的前十五个对表3主题的一些见解如下：话题1：它代表了网民对政府允许开始生产该国本土疫苗班加瓦克斯的努力的赞赏。话题二：当数百万国药、Moderna、辉瑞疫苗运抵孟加拉进行大规模免疫接种时，人们欣喜若狂。话题三：当环球生物宣布他们已经研发出COVID-19疫苗时，网友们非常积极地接受了话题4：人们说他们没有副作用，接种疫苗后一切话题5：在收到第一剂/第二剂疫苗后，neti-tobra向当局和孟加拉国政府表示感谢。表4显示了包含LDA提取的否定陈述的语料库中前五个主题的前十五个对表4主题的一些见解如下：主题1：即使在接种疫苗后，许多人仍然感染了COVID-19。因此，互联网用户对疫苗的原创性提出了质疑。医学博士Zulfiker等人阵列15（2022）1002046图五、积极和消极意见的十（10）天移动平均线。题目二：据网民称，不同的外国在向孟加拉国运送疫苗时涉嫌玩弄政治。他们还声称，外国对疫苗要价很高话题三：网友表示，不同的制药公司和外国都在做疫苗的生意。因此，他们鼓励其他人避免接种疫苗。话题四：网友讨论疫苗的副作用。题目五：当政府尽管向其他国家预付了疫苗费用但仍未能获得疫苗时，网民表达了他们的不满。此外，他们要求政府收回预付的钱3.4. 实施程序本节描述了预测孟加拉国网民整个技术如图所示。第七章以下小节描述了整个过程。3.4.1. 数据清洗Facebook和Twitter用户经常在状态和推文中由于这项研究只关注文本数据，这些表情符号和表情符号已从收集的数据集中删除。网民还利用标签来象征各种趋势和话题。在此步骤中删除主题标签的散列字符。通常，两个或更多个单词被连接在标签单词中，这可能会影响机器学习模型的性能。因此，在这一步中已经分割了标签词3.4.2. 令牌化标记化是分割字符串的单词/术语的技术。在此步骤中，输入数据集的每个语句都已标记化。3.4.3. 删除标点符号和停用词标点符号和停用词的存在可能会导致模型性能不佳。停用词是语言中最常见的词。它们在决定一个声明的极性方面很少有重大影响。因此，标点符号和不必要的停用词已被删除后，执行标记化。作为否定用“not“和“no“这样的词来表示3.4.4. 报表矢量化在这一步中，我们用语料库中最频繁的词构建了然后通过映射每个医学博士Zulfiker等人阵列15（2022）1002047见图6。词云。表2在肯定和否定陈述的语料库中，不同数量的主题的困惑得分。表4负面语料库的前五个主题一些议题积极陈述否定陈述2 - 6.04-6.113-6.10-6.214 - 6.20-6.305-6.26-6.36表3正面语料库的前五个主题双向查找表已被用于将语句的字转换为特定的整数id，反之亦然。3.4.5. 数据分割在这里，获取的数据集被分成训练数据和测试数据。数据集的20%数据已用于构建测试数据集。其余80%的数据已用于训练模型。3.4.6. 分类模型不同的深度学习模型，例如长短期记忆（LSTM）、双向LSTM（BiLSTM）、1D卷积神经网络（1D-CNN）、时间卷积网络（TCN）和一些传统的机器学习模型，例如决策树（DT）、梯度增强（GB）和支持向量机（SVM），已经被用于将网民对疫苗和疫苗接种活动的情绪两极化所提出的深度学习的架构图8（a）-（d）描绘了模型。每个深度学习模型都采用了预先训练的单词嵌入模型。预训练的word2vec和GloVe模型都已在嵌入层中使用所提出的LSTM模型由两个LSTM层组成。第一层有256个LSTM单元，而第二层有128个LSTM单元。在LSTM层之后放置了两个具有整流线性单元（Rectified Linear Unit，简称CNUU）激活功能的密集层。这些LSTM和密集层中的每一层后面都有一个dropout层，dropout率为0.2。最后，应用了Batch Normalization之后，添加最后的致密层它使用了Softmax激活专题1专题2话题3专题4专题5疫苗疫苗疫苗不疫苗人孟加拉国不疫苗孟加拉国孟加拉国中国采取疫苗疫苗不没有人人不剂量疫苗业务疫苗接种得到印度价格剂量发烧钱第一得到印度仍印度电晕印度需要使印度修得部长印度价格政府尿液审判以身体Govt牛知道COVIDu美国阿斯利康人孟加拉国中国时间甚至政治没有疼痛人疫苗接种国药wo头痛国家美国接种血清国家给专题1专题2话题3专题4专题5疫苗疫苗疫苗没有疫苗孟加拉国孟加拉国好侧孟加拉国疫苗疫苗新闻影响剂量最好剂量美国大家伟大部长中国人Alhamdulillah修得希望好孟加拉国花了接种班加瓦克斯万国家疫苗疫苗接种伟大COVID19生物技术得到辉瑞看到国药也医疗二以Moderna全球父母谢谢美国政府政府孟加拉国剂量倡议COVID谢谢罚款新闻欣赏美国真主接种人国家辉瑞需要知道第一恭喜COVAX得到疫苗接种很快医学博士Zulfiker等人阵列15（2022）1002048（%）= ×100（%）= ×100（%）= ×1001- （%）= × 100图第七章预测语句极性的实现程序.功能因为准确度、精密度、灵敏度、特异性和F1评分已被所提出的Bi LSTM模型具有与所提出的LSTM模型几乎相似的架构。它也有两个Bi LSTM层。第一Bi使用以下公式计算用于评估建议模型的性能。LSTM层由100个单元组成，第二个Bi LSTM层由精度TP极性+TN极性32个单位。在建议的1D-CNN模型中，有两个1D-CNN层。第一个CNN层有256个滤波器，第二个CNN层有128个滤波器。这两个层的内核大小都为3。在第一个CNN层之前，是空间丢弃层，丢弃率为0.3。dropout层位于第一个CNN层之后，Global Max Pooling层位于第二个CNN层之后。在全局最大池层之后，有一个包含512个隐藏节点的密集层，后面是另一个dropout层。在这个dropout层之后，还有另一个包含256个隐藏节点的密集层。这个致密层后面还有另一个dropout层。所有这些dropout层的dropout率都是0.3。最后一个密集层使用Softmax激活函数，有2个隐藏节点。在最后的密集层之前，已经应用了批量归一化。所提出的TCN模型由单个TCN层组成，filters.这一层的内核大小为3。TCN层之前是Spatial Dropout层。在TCN层之后，有一个dropout层。该模型由四个致密层组成，包括最终致密层。密集层分别具有512、256、128和2个节点。前三个致密层之后是脱落层。所有这些dropout层的dropout率为0.3。在最后的密集层之前，应用批量归一化。最后的密集层使用Softmax激活功能。在这些深度学习模型中，二进制交叉熵被用作损失函数，亚当被用作优化器。3.4.7. 业绩评价和最后决定在这一步中，我们使用准确度、精确度、特异性、灵敏度和F1得分等几个性能指标来评估所提出的深度学习和机器学习模型基于这些性能指标，已经选择了用于对网民4. 结果和讨论为了分析所提出的模型的性能，已经使用了215个状态的网民。在测试数据集的语句中，56.74%的语句具有正极性，43.26%的语句具有负极性。不同的性能指标，例如（%）=TP极性+TN极性+FP极性+FN极性×100（1）精密TP极性（2）TP极性+FP极性灵敏度TP极性（3）TP极性+FN极性特异性TN极性（4）TN极性+FP极性F评分2×TP极性（5）2×TP极性+FP极性+FN极性这里.TP极性（True Positive Polarity）：当提出的模型将陈述的极性确定为正，并且该陈述的原始极性也是正的，则结果被称为True PositivePolarity。TN极性（True Negative Polarity，真负极性）：当一个模型将一个陈述的极性确定为负，并且该陈述的原始极性也是负的，那么结果被称为真负极性。FP极性（假正极性）：当一个模型将一个陈述的极性识别为正，但该陈述的原始极性是负的，那么结果被称为假正极性。FN极性（False Negative Polarity）：当建议的模型将陈述的极性识别为负，但该陈述的原始极性为正时，则结果被称为假负极性。表5显示了所提出的深度学习模型的混淆矩阵，用于预测网民对疫苗和疫苗接种过程的情绪极性。表6描述了所提出的传统机器学习模型的混淆矩阵。的测量的准确度、精密度、灵敏度，特异性， F1-····医学博士Zulfiker等人阵列15（2022）1002049见图8。提出的深度学习模型的架构。医学博士Zulfiker等人阵列15（2022）10020410表5提出的深度学习模型的混淆矩阵模型预训练词嵌入TP极性TN极性FP极性FN极性LSTMword2vec112732010手套108751814双LSTMword2vec108801314手套11371229一维CNNword2vec109741913手套11467268TCNword2vec108781514手套105791417表6提出的传统机器学习模型的混淆矩阵模型TP极性TN极性FP极性FN极性DT75375647GB89415233SVM97405325所提出的深度学习和传统机器学习模型的得分分别如表7和表8从表7和表8可以看出，深度学习模型在很大程度上优于传统机器学习模型。使用预训练的word2vec嵌入模型的Bi LSTM在深度学习模型中表现出最高的准确率，为87.44%。在准确性方面，基于word2vec嵌入的深度学习模型表现出比基于GloVe嵌入的深度学习模型更好的性能。使用word 2 vec嵌入的LSTM、1D-CNN和TCN模型的准确率分别为86.05%、85.12%和86.51%。另一方面，使用GloVe嵌入的LSTM、Bi LSTM、1D-CNN和TCN模型的准确率分别为85.12%、85.58%、84.19%和85.58%。除了准确性之外，精度、灵敏度、特异性和F1分数在评估机器学习或深度学习模型的性能方面也起着至关重要的作用。采用预训练的word2vec嵌入模型的Bi LSTM在精度方面表现最好，精度达到89.26%。该模型还显示出最高的特异性和F1评分，分别为86.02%和88.89%。基于GloVe嵌入的深度学习模型在敏感性方面表现出比基于word2vec嵌入的深度学习模型更好的性能。使用预训练的GloVe嵌入模型的1D-CNN实现了93.44%的最高灵敏度。在基于GloVe嵌入的1D-CNN模型之后，基于GloVe嵌入的Bi LSTM显示出最佳灵敏度，为92.62%。在传统分类器机器学习算法DT和GB的准确率分别为52.09%和60.47%。SVM、DT和GB的准确度分别为57.25%、63.12%和64.67%。在灵敏度方面，SVM优于DT和GB。其灵敏度为79.51%，而DT和GB的灵敏度分别为61.48%和72.95%。传统的机器学习模型在其他性能指标如特异性方面F1分数深度学习模型的具有曲线下面积（AUC）值的受试者工作特征（ROC）曲线如图9（a）所示。（d）. 当模型的AUC值等于1时，该模型被认为是用于分类的理想模型。如果模型的AUC值等于0.5，则模型将提供随机结果。这意味着后一种模型无法区分不同的类。的AUC所有提出的深度学习模型的值都大于0.9。因此，可以说，所有建议的深度学习模型几乎都是完美的。分类器的ROC曲线是一个二维图，它绘制了该分类器在各种阈值水平下的真阳性率与假阳性率。分类器的性能越好，该模型的ROC曲线越接近图的左上角图图9（a）-（d）示出了LSTM、BiLSTM和TCN的ROC曲线，使用word2vec预训练的嵌入比使用预训练的GloVe嵌入时这些模型的ROC曲线更接近图的左上角。只有在1D-CNN模型的情况下，当使用预训练的GloVe嵌入时，ROC曲线比使用预训练的word 2 vec嵌入更接近图的左上角。图10示出了传统机器学习模型的ROC曲线以及AUC分数。DT、GB和SVM的AUC值分别为0.506、0.646和0.639这些模型的ROC曲线也证明了它们的无效性。因此，很明显，传统的机器学习算法在不同的性能指标方面表现得相当差。通过分析不同深度学习算法和传统机器学习算法的性能，可以得出基于word2vec嵌入的Bi LSTM模型在不同性能指标上都优于其他模型的结论。表8提出的传统机器学习模型的性能指标模型精度精度灵敏度特异性F1得分DT52.09%57.25%61.48%39.78%59.29%GB60.47%63.12%72.95%44.09%67.68%SVM63.72%64.67%79.51%43.01%71.32%表7提出的深度学习模型的性能指标。模型预训练词嵌入精度精度灵敏度特异性F1得分LSTM word2vec86.05%84.85%91.80%78.49%88.19%手套85.12%85.71%88.52%百分之八十点六五87.10%Bi LSTM word2vec87.44%89.26%88.52%86.02%88.89%手套85.58%83.70%百分之九十二点六二76.34%87.94%1D-CNN word2vec85.12%85.16%89.34%79.57%87.20%手套84.19%81.43%百分之九十三点四四72.04%87.02%TCN word2vec86.51%87.80%88.52%百分之八十三点八七88.16%手套85.58%88.24%86.07%84.95%87.14%医学博士Zulfiker等人阵列15（2022）100204115. 结论和今后的工作图第九章深度学习模型的ROC曲线。制造该国第一种本土疫苗的措施。他们还赞赏政府为大规模免疫接种采取的步骤，公众对疫苗的看法在减轻流行病的不利影响方面发挥着至关重要的作用。它还有助于确定疫苗是否有效。本研究分析了孟加拉国公民为了做到这一点，孟加拉国的意见-deshi网民已从不同的社会媒体网站收集。这项研究考虑了2020年6月至2021年7月之间的时间轴网民的意见。在七名志愿者的帮助下，网民们的说法两极分化。为了验证志愿者极性标签的可靠性，评价者间可靠性测试，如进行Fleis 'Kappa和Krippendorf' Alpha可靠性检验。通过分析意见的两极性，可以说，在疫苗接种运动开始后，大多数发言对疫苗持肯定态度。使用LDA模型进行主题建模，以提取潜在的主题的积极和消极的言论的网民。在积极的观点中，表示他们的感谢朝向的政府采取克. 在大多数负面意见中，网友提出了担忧疫苗的原创性他们亦对当局在这项研究中采用了不同的深度学习和传统机器学习算法来预测网友具有预训练的word2vec嵌入的Bi LSTM模型在预测情感极性的不同性能指标方面超过了其他模型。该模型的预测精度为87.44%。这项工作只考虑了网民用英语表达的意见。今后，孟加拉语的意见可以也可以考虑。本研究没有使用BERT、XLNET、ALBERT等基于转换器的本工作中使用的模型的性能与最先进的基于变压器的模型的性能之间的比较研究可能在未来医学博士Zulfiker等人阵列15（2022）10020412图10. 传统机器学习模型的ROC曲线。信用作者声明马里兰州Sabab Zulfiker：方法论，软件，形式分析，写作-原始草稿。Nasrin Kabir：数据管理，可视化，形式分析，写作-原始草稿。Al Amin Biswas：概念化，形式分析，调查，写作-原始草稿。数据管理，写作-原始草稿.穆罕默德·肖里夫·乌丁：监督，写作-评论&编辑。竞合利益作者声明，他们没有已知的可能影响本文所报告工作引用[1] Naseem U，Razzak I，Khushi M，Eklund PW，KimJ. COVIDSenti：用于COVID-19情绪分析的大规模基准Twitter数据集。IEEE传输计算Soc. 系统八月2021;8（4）：1003- 15. 9https://doi.org/10.1109/TCSS.2021.305118九届全国人民代表大会[2] 世卫组织冠状病毒（COVID-19）仪表板。https://covid19.who.int网站。[2022年2月[3] 孟加拉国：世卫组织冠状病毒病（COVID-19）疫苗接种数据仪表板。https://covid19.who.int/region/searo/country/bd网站。[2022年2月5日]。[4] Zulfiker MS，Kabir N，Ali HM，Haque MR，Akter M，Uddin MS.情绪分析基于用户对Facebook和Twitter上拼车服务的情绪反应。见：Uddin MS，BansalJC，编辑。计算智能国际联合会议论文集。新加坡：Springer Singapore; 2020。p. 397- 408. https://doi.org/10.1007/978-981-15-3607-6_32.我的朋友[5] Merchant RM等人，从社交媒体帖子评估医疗条件的可预测性。PLoS One 2019年6月;

下载后可阅读完整内容，剩余1页未读，立即下载