没有合适的资源?快使用搜索试试~ 我知道了~
沙特国王大学学报基于大数据情感分析(BDSA)的软计算技术的熵三元约简软情感集(ETRSSS)的算法实现,用于在线评论Akhilesh Dwivedia,1,R.P.a印度奈尼塔尔Kumaon大学信息技术系b印度奈尼塔尔Kumaon大学数学系阿提奇莱因福奥文章历史记录:收到2019年2019年9月3日修订2019年10月4日接受在线发售2019年关键词:ETRSSSBDSA熵情绪分析大数据软计算A B S T R A C T在我们的日常生活中,我们面临着许多决策问题。大量的文本数据集和这些数据集正在急剧增加,以至于它达到了大数据环境。在这里,我们不仅提出了一个大数据情感分析的框架,对在线评论或文本中的实时更新进行大数据情感分析,以便从现有的N个餐馆的巨大列表中进行最佳或最佳决策选择(例如选择餐馆),而且还通过使用软计算技术将我们提出的框架实现为数学算法(称为算法4.1),用于找到合并评论矩阵的约简软集。我们进一步量化了三个值(1,-1和0)的情感,无论是1还是(posi-1)tive/yes/true)或-1表示(negative/no/False),0表示(neutral或absence of sentiment),并将它们存储起来在一个表(命名为三元情感表)。然后,我们对这个三元情感表进行了熵计算这个提议的量化进一步帮助识别表的最重要属性。它有助于确定不同属性的权重,并将计算出的权重应用于相应的属性,以获得量化的有序决策值。©2019作者由爱思唯尔公司出版代表沙特国王大学这是一个开放的访问CC BY-NC-ND许可证下的文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。1. 介绍使用SCT为BDSA实施ETRSS的主要动机是增加复杂性和大量的数据,用于使用新的和先进的技术解决决策问题各种研究正在朝着这个方向进行为了应对复杂的大数据挑战,已经开展了大量工作因此,已经开发了多种类型的分布和技术(Oussous 等人, 2018年)。这种媒介是由于许多技术趋势,包括物联网、云计算的普及以及智能*通讯作者。电子邮件地址:adwivedi@gehu.ac.in(A. Dwivedi)。1印度Bhimtal图形时代希尔大学CSE助理教授。沙特国王大学负责同行审查。装置(Dwivedi等人,2019; Oussous等人,2018; Botta等人,2016;Pandey等人,2016年)。该调查论文(Ray,2018)的主要贡献在于它系统地总结了各个领域物联网架构的当前最新技术水平。该论文(Al-Ameri等人,2019年)提出SOSE;一种解决方案,用于将子任务卸载到附近的设备上,这将形成“边缘计算资源,我们称之为SOSE_EDGE”,以便能够在任何终端设备上执行MCCS。工业物联网范式指导当前的努力,以实现更好的连接性和提高工业过程运作的智能性,并隐含地刺激数据积累的发生(Nicolae et al. ,2019 年)。参考文献(Ray和Dash,2019; Calo等人,2017)倡导行业标准和边缘计算元素的关键作 用 , 以 结 合 物 联 网 来 展 示 压 倒 性 的 增 强 用 户 体 验 。 在 论 文 中(Dwivedi等人, 2019; Dwivedi等人,2019年),讨论了使用电子政务与大数据框架的好处。还可以开发各种安全技术来保护文本数据集( Akhilesh 等 人 , 2010 , 2011 a , 2011 b , 2018; Akhilesh 和Aparna,2013; Akhilesh和Suresh,https://doi.org/10.1016/j.jksuci.2019.10.0011319-1578/©2019作者。由爱思唯尔公司出版代表沙特国王大学这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。制作和主办:Elsevier可在ScienceDirect上获得目录列表沙特国王大学学报杂志首页:www.sciencedirect.comA. Dwivedi,RP Pant/沙特国王大学学报2119---2011; Dwivedi等人,2013; Kumar和Dwivedi,2017; Suyal等人,2016年)。一个真实案例的经验和教训,可以为高校分析和引导网络舆论提供有力的数据支持和可行性建议(He et al., 2019年)。 参考文献(He et al., 2019)提出了一种基于时间序列的网络舆情分析系统。参考文献(Mohammed et al.,2019)提出了一种不确定的软集,通过混合两种软集约简技术产生显著的结果,而不影响数据的特定特征 。 参 考 文 献 ( Mohammed et al. , 2019 ) 描 述 了 参 考 文 献(Mohammed et al., 2019)提出了一种参数约简算法,称为3C算法,以规避约简中的各种虚假对象。现代重要的大数据方法最终将成为常规方法,非专业人员可以在不需要咨询服务的情况下完成任务。与当今的任何标准计算平台非常相似(Chng等人, 2019年)。大量数据在软集合中可用,这使得识别数据的软集合决策具有挑战性(Mohammed等人, 2019年)。正如本文在这里,我们创造了一个缩写ETRSSS。我们想把ETRSSS的思想表达为三元约简软集上的熵计算。它是从三元情感表中减少非常不重要的参数或不需要的参数之后的结果。此三元表用数值“1”、“1”、“0”填充。数值“1”被分配给积极情绪(基于肯定形容词的存在),值1表示否定情感(基于否定形容词的存在),值0表示中性情感或无情感(基于肯定或否定形容词或属性的不存在)。文本评论证明了买家的感觉,而不仅仅是从买家那里获得0到5或0到10的评分。因为分数可能是假的或错误地生成的,也可能是在没有买方的任何兴趣的情况下提供的。高评级可能是由于在产品或服务上给予额外的非法折扣,服务提供商或业务利益相关者。因此,要为客户带来在线产品或服务的真实场景的原创性,依赖于相关的和写得很好的文本,并使用合适的形容词。因此,大数据情感分析增加了基于精确数学情感分析的决策的影响力和重要性。因此,需要一种快速而精确的方法,以与情绪相关联的合并排序的数字决策值(如从高数值到低数值)(最高数值强烈购买,下一个更高的值购买,以及较低和最低数值不购买)的形式对这种文本或大数据评论进行分类。产品或服务的决策或选择有助于-能够通过互联网网站是具有挑战性的新买家,基于在线评论,文本,和反馈,从以前的买家。莫洛佐夫爵士的奇妙的软集理论解决了决策和不确定性理论中的各种问题本文提出了一种基于熵计算和软集参数约简相结合的数学方法,以实现大数据环境下快速准确的决策虽然这种方法可以应用于各种结构化数据集或基于事实的数据集的问题。例如,板球运动员在IPL的不同团队的多选择标准),尚未解释和实施其可用性。我们试将其应用于BDSA,以帮助新的在线买家轻松做出决策。该方法还允许制造商或服务提供商理解和采用快速变化。产品或服务所需的变化依赖于消费者产品的新版本在电子商务、经济学、工程学、科学等领域都存在着一些关键的、具有挑战性的决策问题,这些问题在大数据领域正日益逼近。而且,它们无法通过使用简单的基于概率的算法和清晰集或朴素贝叶斯标准在快速的时间范围内解决。模糊集、粗糙集和概率论都缺乏约简参数的充分性。因此,Molodtsov爵士引入了软集合理论的概念(Molodtsov,1999),Pawlak爵士将软集合用于不同的目的(Pawlak,1982; Pawlak和Ziarko,1994)。寻找约简软集(约简参数化软集)的软计算特性令人印象深刻。我们看到它在应用于关系数据库或数据表格格式的大型动态结构化数据集时的用途在线电子商务业务抓住了当前的互联网使用场景,几乎占全球市场的一半。在在线电子商务网站或社交网站上,来自客户的反馈已被收集在大量文本中,具有动态性质或具有速度、准确性以及各种形容词和各种情感形式的文本。基于具有体积、速度、准确性和多样性值(5V)的特征,我们可以将它们声明为用于感测分析的大数据(BDSA)。这些积极、消极或中性的情绪不仅有助于利益相关者或投资者或公司了解买家喜欢什么。以及产品或服务中需要的更新。它还建议如何让他们在同一个或不同的网络平台上参与未来的在线购买选择。大数据情感分析是必不可少的快速执行技术与准确的决策能力,以实现我们的下一个目标。因此,作者提出了软计算技术与BDSA的使用。然而,使用各种模糊逻辑技术和模糊集、粗糙集和软集方法以及用于在大数据情感分析环境中进行决策的组合混合方法可以用于实现未来复杂的决策目标(Bakshi等人,2016; Maji等人,2003; Awang,2010)。其中最具吸引力和最新的理论是软集合理论,以解决买方决策的不确定性的挑战。软集三元表是在大数据集上进行情感分析的最有用的特征或技术因为它的结果要么是我们将决策结果按有序数值从高到低进行分类,并与多个决策标准(从强烈接受是到严格拒绝否)相关联。这就是为什么我们有动力使用熵计算方法和软集技术。对于新买家来说,决策有点困难。这是因为太多的时间消耗在阅读每一个单一的审查或冗长的文本,并得出多种不同的意见。图1显示了以下拟议框架。它是迄今为止最快的方法,用于优化选择决策问题,而不是PK Maji爵士在论文中提出的现有技术(Maji等人,2002年)。这是所提出的方法的特点。结果和讨论分析了比较马吉爵士熵是一种数值度量,表示有多少信息增益作为结果存储在数据中。使用熵计算进行大数据情感分析是为了减少冗长分析过程的不必要开销,如在Sir Maji的(Majietal., 2002年)。和其他复杂的数学使用朴素贝叶斯和隐马尔可夫规则的数值计算。上述图 1描述了拟议系统的工作流程。使用实时更新比等待更有意义2120A. Dwivedi,RP Pant/沙特国王大学学报-图1.一、熵三元还原软情感集(ETRSSS)框架,使用软计算技术进行大数据情感分析(BDSA)。累积更新的文本文件,用于独立的情绪分析。因为使用实时更新,自发地提醒和更新客户和利益相关者关于当前的情况. NoSql的用途是将实时更新存储在评论中,用于文本大数据存储目的。因此,我们使用NoSql和Map-Reduce paradigm进行决策数值的实时更新。NoSql和Map-reduce是解决大数据动态性问题的流行方法,涉及5V(值,卷,速度,多样性和准确性)。评论的NoSQL文档或JSON对象表示在评论合并器中进一步合并。审查合并程序提取产品的主要特征。此合并审查将传输到发送决策表创建者。情绪决策表创建器将存储与审查的统一特征相对应的数值(1,0,1)。在创建TSSS表之后,将应用软计算技术来开发简化决策表(TRSSS)。我们使用权重计算器来制作WTRSSS表。此外,熵计算器被应用于计算ETRSSS。数据服务块将比较NoSQL文档的输出,并将熵计算器和存储有序的数字决策值。我们在复杂的大数据环境中使用这些数值进行决策。IPython项目提供了一个增强的交互式环境,其中包括对数据可视化的支持以及分布式和并行计算的设施(Pérez和Granger,2007)。我们使用python编程实现了所提出的方法,以证明通过使用reduce软集(减少参数化软集表)与熵计算的组合,可以比以往任何时候都更快地使用文本数据进行决策问题。如果我们将这种方法应用于基于事实或证据的数据集(就像任何其他数据集一样),数字数据集,例如房屋价格预测数据集可在参考(www.Kaggle.com的网络存储库)。它会比以往任何时候都快。在第二节(软集合论)中,我们用公理和性质解释了软集合论的经典数学。以及各种数学运算以及如何生成约简软集,用于大数据情感的三元情感软集表的约简参数化。我们讨论了软集的甜蜜的可用性和它的各种属性。我们还讨论了寻找归约(不可用的观点或没有目的的观点)的使用(Pant等人,2017年)。这些简化(不可用的情感)将被删除,以将焦点放在产品或服务的完全积极的方面或纯粹消极的方面。在第三节中,我们从TSSS中获得了三值约简软情感集(TRSSS)。并将我们的数学结果与Majhi爵士的论文中的实际结果进行比较(Maji等人,2002年)。在第4节中,我们开发了我们的算法(算法4.1)的一般化版本。算法4.1使用大数据情感分析(BDSA)上的软计算技术来证明熵三元还原软情感集(ETRSSS),以基于在线评论中的实时更新来进行决策的最优选择。在第5节中,我们讨论了将算法4.1实现为用Python开发的软件程序的方法。根据文本评论从五家餐厅中选择一家最佳或最好的餐厅。这个实现的完整python代码可以在附录1中找到。在第4节中,我们讨论了程序实现的结果,这很好地证明了我们的算法4.1的成功。在第7节中,我们总结了本文,并阐述了这一方向的未来工作范围。A. Dwivedi,RP Pant/沙特国王大学学报2121ðÞð ÞFGfgFGf/gfgfg2. 经典数学软集合论软集理论有助于将买家的评论映射为三值矩阵(TVM)表。再利用 软 集 技 术 对 该 矩 阵 进 行 降 维 , 得 到 二 进 制 计 数 矩 阵(BinaryCountMatrix,简称BMT)。我们在这里解释软集合理论的基本原理和软集合理论在参考数据集上的一些基本数学运算(www.Kaggle.com的Web存储库,2018)。Molodtsov爵士将软集合定义为信息系统或知识表示系统(Molodtsov,1999)。设U是一个泛集,E是一组元素或参数。设P(U)表示泛集U的幂集,A是属性集,E(Molodtsov,1999)。2.1. 软集合关系数据库的表或矩阵表示其行和列之间的关系(Sezgin和Atagün , 2011 ) 。 同 样 , 知 识 表 示 系 统 类 似 于 关 系 数 据 库( www.Kaggle.com 的 Web 存 储 库 , 2018; Sezgin 和 Atagün ,2011)。软集的知识表示系统是四元组(www.example.com的Web存储库www.Kaggle.com,2018),即4元组(Maji等人,2002;Bakshi等人,2016; Maji例如,2003; Awang,2010)。知识表示系统也被称为属性值系统或有时称为信息系统(Bakshi等人,2016年; Sezgin和Atagün,2011年)。[S/CN;A;V;F/CN;10]其中,U是一个非空的有限对象集(Universal Set)A是一个非空的有限属性集(Attributes Set)V是一个属性值集(Value Set)F是信息函数(函数表示)定义2.1.1(参见(Maji et al.,2002; Chen等人, 2005))。 A关系<$F; A <$称为U上的软集,其中F是由下式给出的映射<$F:A!P U。换句话说,U上的软集是一个参数-宇宙U的子集族。对于每个es A; F e考虑-记作软集合F的e-近似元的集合;A .(Awang,2010年)。一个软集不仅仅是一个集(阿旺,2010)。为了解释这一点,Molodtsov爵士考虑了参考文献中的几个例子(Molodtsov,1999年)。基于Molodtsov爵士提出的示例,我们假设一个基于实时评论决定预订餐厅的问题(以文本数据的形式更新大数据以用于发送分析 ) 。 某 人 在 以 下 在 线 链 接 上 发 布 的 数 据(https://www.kaggle.com/apekshakom/sentiment-analy-sis-of-restaurant-reviews)(www.Kaggle.com的Web存储库,2018)问题2.1.1.让我们假设一个演员匈牙利李女士 她想从n个可用的餐馆评论中选择最好的餐馆(例如,让我们假设有五家餐馆,分别命名为“餐馆1”、“餐馆2”、“餐馆3”、“餐馆4”和“餐馆5”)。他们的评论可以在网上找到,比如在链接(https://www.kaggle.com/apekshakom/sentiment-analy-sis-of-restaurant-reviews)上打开根据以上链接提供的在线文本评论,为匈牙利李女士的郊游选择一家餐厅Hungry Lee女士需要对餐馆进行有利的分类,以便做出决定。它应该依靠经验丰富的买家发布的评论。问题2.1.1的一个解决方案假设下面的例子:U是正在考虑中的名为(餐馆1,餐馆2,餐馆3,餐馆4,餐馆5(https://www.kaggle.com/apekshakom/sentiment-analysis-of-餐馆评论)的餐馆通用集合。每个参数都是一个词或形容词,用于生成情感E = {美味;卫生;干净;物有所值;美味;物有所值;物有所值;昂贵;现代;好;坏}等。在这种情况下,定义一个软集意味着指出美味的餐厅,物有所值的餐厅,等等。软集(F,E)描述我们将在下一个讨论中更详细地考虑同一个示例。假设宇宙U中有六家餐厅,由U^f a1; a2; a3; a4; a5; a6g和E^f e1; e2;e3; e4; e5g给出,其中e1代表参数“好”假设对于不同的参数,不同的餐馆被识别为如下所示:F=1;a=2;a =6g;F =2;a=1;a =2;a =6 g;F=3; a= 2;a =5;a =6 g;F=4; a=3 g;F=5gf4;a6 g:的软设置F;E是一参数化家庭F e; ;i1; 2;3;::; 8集合U的子集的集合,并给我们一个对象的近似描述的集合(Maji等人,2003;Basu等人,2012年)。考虑映射F,它是“餐馆(.)",其中dot(.)用参数2E来填充因此,我们认为,Fe1的意思是seta1;a2;a6;因此,我们可以将软集合F;E视为近似的集合,如下所示:F;E其中,每个近似都有两个部分:谓词p和近似值集例如,对于近似美味Restau- rants因此,软集合(F,E)是以下近似的集合(Maji等人, 2003年)的报告:F;E································································为了快速分析大数据,我们需要以表格格式存储所有类型的数据,或者我们称之为结构化数据集。我们在三元情感表中示出了上述数据样本的结构化数据集表示,如下面所示的表1如果Ai2Fe,则Aij¼1表示肯定形容词,然后Aij¼ -1表示否定形容词。否则Aij0表示评论中没有提到形容词,其中Aij是表1中的条目。因此,软集合现在可以被视为知识表示系统,其中属性集合将被参数集合替换(Maji等人,2002; Awang,2010)。这对于在计算机存储系统中存储三元软情感集(TSSS)是有用的。用于证明描述的其他相关定义和示例如下。在下一节中,第3节,我们将找到TSSS的约简或( 从 TSSS 减 少 参 数 化 ( Reduct ) Ternary Soft Sentiment Set(RTSSS))。一个软集合<$F;E<$的所有值集的类称为软集合的值类。它是CF;E。对于上面的例子,CF;E=2122A. Dwivedi,RP Pant/沙特国王大学学报8C ccC82eð Þ ≥ ðÞe eeF A G B法国足球联合会ð Þ ð Þ ð ÞðÞðÞð Þ ðÞðÞðÞðÞ⊂ ð Þ ðÞðÞ表1三元软感情设置表选择具有不同参数的尊贵餐厅。U美味p1 1/4v1物有所值p2/4v2美味p3/4v3美丽p4/4v4好p5/4v5a11 1 0 0 1a21 1 1 0 0a30-1 0 1 0a4-1 0 0 0 1a50-1 1 0 1a61 1 1-1 1{v1;v 2;v 3;· · ·:;v ng. CF;EPU(Roy andMaji,2007)表示类是幂集U的子集。Fca:U-F:aa2:A (Roy和Maji,2007;Yao等人, 2008年)。我们称Fc为F的软补函数. Fcc是定义2.1.2.对于公共环上的两个软集<$F;Af和<$G;Bf与F和F; Ac c f; A ccF相同。UniverseU,我们说,如果(i) 一个B,和(ii) (二)eA、F(e)和G(e)是相同的近似(Maji等人,2002年)。我们写G;BF;A:(F,A)被称为是一个软超集,若G; B是F; A的一个软子集,则G ; B是F ; A的一个软子集。我们将其表示为的情况。定义2.1.3.两个软集共享论域U上的两个软集合<$F; A<$F和<$G; B<$F被称为软相等,如果<$F; A <$F是<$G的软子集; B<$F和<$G; B<$F是<$F的软子集;A<$G(Ma等人,2010; Yao等人, 2008年)。实施例2.1.3. 设A 1/4 fe1;e2;e5gE;和B1/4 fe1;e2;e3e5gE:很明显,设F;A和G;B是同一论域上的两个软集U¼ fa;a2;a3;a4;a5;a6g,证明了G(e1)={a2;a4g,G(e2)={a1;a3g,G(e3)={a3;a4;a5},G(e5)=(a1),以及F(e1)={a2;a4g,F(e3)={a3;a4;a5},F(e5)={a1),因此,F;AG;B:定义2.1.4(不是一组参数的集合)。让E^fe1;e2;e3;e4;e5g是一组参数。E的非集合记为E。它是eee1;ee2;e ee3;eEe4;ee e5g。哪里ei=不是ei,Vi。 (It可以注意到,和是不同的运算符。)以下结果是明显的(Ma等人,2010; Yao等人,2008年)。提议2.1.4.1. e(eA)= A.2. eA [B]=eA [e B]=eA [e B] 3. e(A\B)=(eA\e B)。实施例2.1.4.考虑上面示例中给出的示例2.1.1.在这里,E = {不好吃;不物有所值;不卫生;不漂亮;不好}(Roy和Maji,2007)。定义2.1.5(软集的互补软集(Roy和Maji,200 7))。软设置1990年,补充是(F,A)C.它和是F;A是F;e是A。其中F:EA!PUa映射给出实施例2.1.5.考虑例2.1.1。这里,F; E ={不好吃的餐厅={a 3; a 4; a 5}=ef a 1; a 2; a 6},不物有所值的餐厅= {a 3; a 4; a 5; a 6}= ef a 1; a 2;},不卫生餐厅={a1; a3; a4}=ef a2; a5; a6},不漂亮的餐厅= {a1; a2; a4; a5}= a3; a6},不好的餐厅= a1; a2; a3; a5;}= {a4; a6}(罗伊和Maji,2007年)。3. 从TSSS中寻找三元约简软情感集在泛代数理论中,一个代数结构的“约简”是在省略了该结构的某些运算和关系后得到的“缩减”的逆词是“扩展”(Herawan等人, 2010年)。在软集合论的情况3.1. 减少软集示例考虑软集合F;P(Maji等人, 2002年)。 显然,对于任何P,E;F;P是F;E的软子集。我们现在将定义软集F ; E的约简软集(Maji等人, 2002年)。考虑软集F;E的表格表示。如果Q是E的约简,则软集F;Q称为软集F;E的约简软集。 直觉,一个约化软集F;Q 是最基本的部分,它足以描述软集F;E的所有基本近似描述。 F;E的核心软集是软集F;C,其中C是核心E(Lin,1996)。在参数缩减之后得到降维表的想法是得到相同的决策。但快速决策不影响以前从长表中获得的结果。 我们可以说这个表是由Rp表示的简化参数表。我们需要消除这些参数是dispensable和调用他们参数约简,我们只感兴趣的参数是必不可少的。以这种方式,我们从表1获得表2。参数约简(可忽略的参数)是表1中可分配的参数。让 为了得到参数约简或(约简参数软集三元表),其最小化情感快速决策中的时间消耗;我们应用三步算法(Pant等人, 2017年,在下面。算法3.1.a. 将数据集转换为三值信息系统(如表1所示),S=(U,A,V(0,1),f)软集合理论用于这种转换(Pawlak和Ziarko,1994; Sezgin和Atagün,2011)。A. Dwivedi,RP Pant/沙特国王大学学报2123-⊂⊂ðÞ公司简介[2]P表2三元还原软情绪设置表选择具有不同参数的尊贵餐厅。b. 输入软集合(F,E),输入Hungry Lee女士的选择参数的集合P,它是E的子集(Pawlak和Ziarko,1994)。下一个过程是对应于Hungry Lee女士的选择参数的1、0 s和1 s的输入(Sezgin和Atagün,2011)。c. 删除不必要的项(1或类似列值的数量较少)。在(F,P)的所有约简软集中,其中P E,选择(F,P)的一个约简软集,例如(F,Q)。如上所述,Q = {el,e2,e3,e5}和N ={e2,e3,e4,e5}是P = {e1,e2,e3,e4,e5}的两个约简(Pawlak和Ziarko,1994)。但实际上,我们不能同时得出结论,这两者都是分区表Rp 的约简,其中P = {el,e2,e3,e4,e5}(Pawlak和Ziarko,1994; Sezgin和Atagün,2011)。3.2. 算法3.1的解释:在我们先前的出版物中,“A Real Time Application of Soft Setin Parameter Reduction for Decision Making Problem”(Pant等人,2017),我们已经解释了如何找到软集的约简和共生和支持值。在本文中,我们使用python实现了相同的功能,如下面的实现部分所示。根据参考文献(Zadeh,1965),使用的概念的不 可 分 辨关 系在 分 区 表 Rp 上 的 Ri¼ffa1g;fa2g;fa3g;fa4g;fa5g;fa6gg,其中P={el,e2,e3,e4,e5},其中PE(Pawlak和Ziarko,1994年;Lin,1996),则共现集合将为共现(a1)={e1,e2,e5}同现(a2)={e1,e2,e3}同现(a3)= {e4}同现(a4)= {e5}同现(a5)= {e3}同现(a6)= {e1,e2,e3,e5}。此外,对于表1,每个对象的支持度值可以由下式给出:支持度(a1)= 3支持度(a2)= 3支持度(a3)= 1支持度(a4)= 1支持度(a5)= 1支持度(a6)= 4(Pant等人,2017年)。因此,结论是,如果从P中删除{e4},则不相容关系Ri(Pant等人,2017; Kumar和Rengasamy,2013),并且分区Rp不是变体,因此e4在P中是不稳定的(Pant et al.,2017年; Kumar和Rengasamy,2013年)。3.3. 基于对象的选择值的计算选择决策(餐厅ai)对象ai2U的选择值为Ci,由Ci<$jaij(Maji等人,2002年)。aij是约简软集的表中的条目(Maji等人,2002; Bakshi等人,2016年)。算法3.2. Hungry Lee女士可以遵循以下算法来选择她希望外出或送货上门的餐馆1. 输入软集F;E(Maji等人, (2002年)2. 输入作为E的子集的Hungry Lee女士的选择参数的集合P(Maji等人,(2002年)3. 找到所有的约简软集(Pant et al.,(2017年)4. 选择一个约简软集,例如<$F;Q<$或<$F;P<$5. 求该行的和作为选择值Ci6. 找到k,其中C k^maxC i(Chen等人,(2005年)7. 则Ak为最优选择对象。8. 如果k有不止一个相同的值,那么Hungry Lee女士可以使用此选项选择其中任何一个(Roy和Maji,2007)。现在,我们使用算法3.2来解决我们的原始问题,并开发一个新的修改算法。很明显,从表中,我们看到的fe1;e2;e3;e5g;fe1;e2;e3;e4g是的两约简的Pe1;e2;e3;e4;e5和Qe1;e2;e3;e5(Maji等人,2002; Lin,1996; Ezugwu和Adewumi,2017)。从上面选择任何一个,比方我们只需删除表1中e3的列,从P中求出Q.简化选择值,可以在下面的表2中表示三元简化软情感集(简化参数化三元软情感集(TRSSS表))(Maji等人,2002; Lin,1996; Ezugwu和Adewumi,2017)。这里max(Ci)=C6¼ 4。决定:饥饿的李女士可以从a6类型的餐厅买一顿饭.如果假设C i有两个相同的选择值(Maji等人,2002年)。然后,可能发生的是,通过从餐馆购买膳食,属于“P”的所有参数对HungryLee女士来说不是同等重要的(Maji等人, 2002年)。然后,她可能喜欢施加重量(Maji等人,2002年; Ezugwu和Adewumi,2017年)关于他的选择参数,即,对应于每个元素pi2P。存在权重Wi0; 1参考(Maji等人, 2002年; Ezugwu和Adewumi,2017)。在下一节中,我们讨论了基于“加权三值约简软情感集(WTRSSS)”的决策。3.4. 基于“加权三元约简软情感集“的决策选择在(Bakshi等人,2016; Lin,1996),Majhi爵士定义了一种新的数学分析理论,即“W-软化理论”。“W-软集合”表示加权软集合。我们定义了约简软集的加权表(WTRSSS表),其中将有条目}dij<$Wjωaij},而不是0和1和-1。只是,在ij是2124A. Dwivedi,RP Pant/沙特国王大学学报ðÞPðÞðÞðÞð Þ ðÞ我我ðÞðÞðÞð Þ ðÞ[2]P-ωP我我我约简软集F;Q的表2中的条目(Maji等人,2002;Bakshi等人,2016;Debadutta,2016)。3.4.1. 对象的加权选择值ai,对象ai2U的加权选择值为Ci,由下式给出Ci¼Xdij½1;5;20]J其中,}d ij<$W jωa ij}对他的选择参数施加权重(Maji等人,2002;Bakshi等人,2016年; Ezugwu和Adewumi,2017年),Hungry Lee女士现在可以使用以下修改后的算法进行最终决策。3.4.2. 基于随机加权选择值计算的餐厅选择决策的修正算法(算法3.3.2)1. 输入软集F; E,2. 输入作为E的子集的Hungry Lee女士的选择参数的集合P,3. 找到所有的reduct-soft-setsF; P4. 选择一个约简软集,F; Q的F; P5. 根据Hungry Lee女士确定的随机权重,找到软集合F; Q的加权表6. 求k,其中Ck½ max Ci。则Wk为最优选择对象。如果k有多个相同的值,则Hungry Lee女士可以使用算法3.3.2选择3.5. 算法示例3.3.2现在让我们使用修改的算法3.3.2(Maji等人,2002; Bakshi等人,2016年; Ezugwu和Adewumi,2017年)。假设Hungry Lee女士为Q的参数设置以下权重:对于参数从表2中,Hungry Lee女士选择(F,Q)以得到下表3请注意,匈牙利Lee女士(买方)选择0和1之间的权重,即Wi0; 1。从表3中可以清楚地看出,从算法3.2使用算法3.3.2保持不变。它还表明,饥饿的李女士想买一顿饭,根据他的最高加权选择参数(WTRSSS的最高值),即(C6= 3.0)。在下一节中,我们将提出一种更准确、更耗时的方法。因为权重的随机分配可能需要时间进行进一步计算。因此,我们应用熵计算并比较上述结果4. 三元约简软情感集上的熵计算(ETRSSS表)现在,我们不应用选择值方法(Algo 3.2)或加权三元还原软感觉集(WTRSSS方法)或(Algo 3.3.2),而是直接将我们的熵计算方法强加于表2(三元还原软感觉集(TRSSS表))。我们称这个算法为Algo 4.1。结果存储在表4中。算法4.1.1. 输入软集F; E(www.Kaggle.com的Web存储库,2018)2. 输入作为E的子集的Hungry Lee女士的选择参数的集合P(Maji等 人 , 2002; Bakshi 等 人 , 2016; Ezugwu 和 Adewumi ,2017)3. 找到所有的reduct-soft-setsF; P4. 选择一个约简-软集F; QF; P5. 根据Hungry Lee女士确定找到软集合F ; Q的加权表,6. 查找行熵和=RES=R iPn p e i洛格贝伊7. 找到柱熵Sum = CES= C iP-npeiω洛吉佩河8. 求A O,其中arg max RA Oi<$$> maxRjR i<$\maxRjC <$。9. 则AOi为最优选择对象10. 此外,还证明了(RES + CES)的最大值=最大值(AOi4.1. 算法4.1说明行熵和最大值(RES)将吸引李小姐选择6型餐厅。列熵和的最大值(CES)将告诉Hungry Lee女士关于属性的信息。“卫生”是最重要的方面,这是以前的买家更关心的。从表4中可以很清楚地看出,根据ETSSS表,A 6类型的餐厅或餐馆6是Hungry Lee女士购买膳食的最佳选择。现在另外表3简化的参数化三元软情感集(RTSSS表),具有用于基于在线情感从餐馆购买膳食的选择值Ci。A. Dwivedi,RP Pant/沙特国王大学学报2125J表4‘‘Weighted Ternary Reduce Soft Sentiment Set‘‘ (WTRSSS decision table) having arbitrary or random weight choice numeric value assigned by (MsHungry Lee)计算行熵和与列熵和之和,该值带来熵例如,对www.kaggel.com上餐厅评论的分析(www.Kaggle.com的网络存储库,2018年)sum; arg maxRA我 最大值RiR iC i。因此,在所有行和主题:在这里,我们的主题是所有餐厅评论,互联网列和,最大数量是表4的第6行和第3列数据,这是算法4.1的最佳最高值表4的最佳最高值为,即2 + 1.29 = 3.29。这也意味着一个新买家自信地购买了一家6类型的餐馆或因此,所提出的算法4.1不仅速度快,而且还具有可扩展性。同样,表2它依赖于由先前买家提供的评论的情感,具有其他买家最喜欢哪个属性的附加信息。这种方法的另一个优点是,假设买家通过情感关键字'good'搜索goodRestaurant}e5}因此,相应的Max(熵和)的总和将是对买方最有利的再次对应列的0值- n5行的最即6型餐厅。因此,在缩减参数化(Reduct)三元软情感集(用于BDSA(大数据情感分析)的RTSSS表)上实现熵计算将导致更快和准确的决策制定。然后,在下一节中,我们使用Python实现了算法4.1我们在下面讨论我们的结果5. 算法4.1(ETRSSS)广泛的研究激励我们实现ETRSSS算法。它的应用验证了它的可扩展性和性能,以及针对BDSA(用于文本审查中实时更新的大数据情感分析)的可移植性此外,为了分析所提出的方法的真实性,我们使用Python语言实现了所提出的数学,我们在论文的结果和讨论部分讨论了我们的发现。我们使用软集合理论的经典数学来对冗长的基于情感的数据集(通常称为大情感数据)进行特征或参数在使用Soft Set Reduction技术进行情感分析时,我们将分析每个对象的评论在应用算法之后,它将为我们提供该主题的情感的统一视图见上图1。对象:此类别下的每个餐厅都是一个对象属性:每个餐厅将使用预定义的一组字典属性,例如美味,卫生,昂贵,便宜,不昂贵,物有所值,等等.情绪:购买者对每个对象的集体反应以数字形式表示为正或负,即每个餐
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- RTL8188FU-Linux-v5.7.4.2-36687.20200602.tar(20765).gz
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
- SPC统计方法基础知识.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功