没有合适的资源?快使用搜索试试~ 我知道了~
可在www.sciencedirect.com在线获取ScienceDirectFutureComputing and Informatics Journal 2(2017)118e124http://www.journals.elsevier.com/future-computing-and-informatics-journal/为电子商务网站生成功能级别审查表,以生成产品D.R. Kumar Raja*,S. 普什巴部圣彼得大学,印度接收日期2017年6月23日;修订日期2017年8月7日;接受日期2017年9月10日2017年10月20日在线提供摘要人们普遍认为,电子商务正在迅速发展。这只是因为人们完全依赖于已经购买和使用产品的客户给出的评级和评论。在线调查、购物网站上的客户评论是了解客户需求和反馈的关键来源,有助于提升产品质量并取得更大成果。现在的挑战是,这些评论是来自产品层面还是功能层面将是百万美元的问题。为了克服这个问题,我们提出了一种新的算法,给功能级别的评级的产品,这是所谓的功能级别审查评级分析(FLRRA)算法。©2017埃及未来大学计算机与信息技术学院由爱思唯尔公司制作和主持这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。关键词:在线调查;电子商务业务; FLRRA算法; FLRT;评论;评级1. 介绍在线用户生成内容的分析因其广泛的应用而受到学术研究者和行业利益相关者的关注。由于互联网的便利性和可用性,每个客户都可以在家中检查产品的耐用性,可持续性和可用性[1]。每个客户将检查产品评级和评论购买产品之前.一般来说,不仅电子商务网站,而且每一个服务型企业,如酒店,医院,atres,购物中心,游乐园,几乎每一个服务提供企业现在都在互联网的帮助下在线运行。* 通讯作者。电子邮件地址:kumarrajadr@outlook.com(D.R.Kumar Raja),stpetersuniversity.org(S.Pushpa)。埃及未来大学计算机和信息系负责的同行审查例如,在购买产品之前,先对产品进行一些调查。一般来说,这是在已经购买的人的帮助下完成的,但现在在网上购物的帮助下,我们将寻找购买和使用产品的客户的评论。不仅在购买产品之前,而且在访问任何新的地方之前,如果我们应该预订假期旅游,那么首先,我们将检查我们可以去的地方,我们可以呆在哪里,以及附近的所有旅游景点都是什么样的,我们可以在互联网上检查。每个客户都会看到的唯一一件事是已经访问过该地方的人在评论方面给出的反馈。最大的问题,为客户谁是要采取决定取决于评级所给予的现有客户是“天气的评级是真实的不是?Amazon.in”https://doi.org/10.1016/j.fcij.2017.09.0022314-7288/©2017埃及未来大学计算机与信息技术学院由爱思唯尔公司制作和主持这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。D.R. Kumar Raja,S.Pushpa/Future Computing and Informatics Journal 2(2017)118e 124119在本文中,我们提出了一种新的方法,它是用来生成的评级取决于客户写的评论的产品的通用算法的帮助下。2. 现有工作由于我们将亚马逊视为数据来源,因此用于对亚马逊产品进行评级的评级过程将导致Flase_Positive,这反过来又会导致客户通过看到虚假评级的产品来购买产品[2]。例如,考虑由Amazon中的用户给出的示例产品评论,如下所示图1显示了给产品评级的过程。至于当评级是以星星的形式,我们可以理解,最高的星星数量表明产品的整体评级是好的,客户满意的最大程度。如果达到最小值,则表示客户对产品完全失望,并且不符合客户的需求范围,剩余的评级过程给出了对该产品部分满意的中等客户的满意范围。让我们看看一些其他的例子,为产品的整体评级在下面的图. 图 二、这说明客户对产品满意,他们以星级的形式给出了评级5。我们将尝试通过使用亚马逊网站上的一些示例评论来体验这种传统的评分过程。这些示例将说明审查过程将如何导致假阳性机制。 图 3.图4是False_Positive情形的示例。这描述了一个特定的客户已经给了产品的评级为5,并在描述部分,他写了:“该产品是最差的”。我们可以说这两种情况是相互矛盾的,也是非常困难的用户谁是试图购买该产品。这种类型的评论和评级会把客户带到一个混乱的状态。这里没有说明产品质量和功能。 图 五、这也是Flase_- Positive情况的另一种评级过程,描述客户给出的评级为1,他们将产品描述为良好。这样的评级过程也把客户带到了一个混乱的状态,买不买产品。这类例子的评级过程不明确,这将使客户陷入混乱状态,并将显示对购买产品的负面影响。这种评级的实际问题是,对产品的描述不清楚,而且他们也没有提供评级的功能级别。字功能级别评级将给出面向描述的产品评级,我们正在介绍这种机制,在我们提出的方法。这里的主要问题是,我们可以选择的产品评级的形式,星级从1到5缩放。在这个过程中,5代表我喜欢它,1代表我讨厌它。甚至是我们选择5,这意味着我喜欢这个产品,我们可以在评论中写为“这个产品是最差的”。这将导致假阳性的情况。3. 拟议工作通过分析所有现有的审查和评级过程,我们观察到产品评级不明确,也没有产品的功能级别评级,这有助于客户根据特定功能购买产品。在我们提出的方法中,我们试图通过考虑用户给出的评论来专注于产品的功能级别评级过程[4]。在这里,我们试图从评论中识别“key_terms“。这些关键术语是通过大数据分析中的关联规则挖掘得到的。在确定了关键术语之后,我们将把它们与产品联系起来,同时我们也将尝试从客户的详细评论中确定关键模式。稍后,我们将在所有关键术语和关键模式之间建立联系,以生成特征级别评级。关键词是以正面自然的形式描述产品本质的术语,如“好、棒、精、妙“等[5],可以识别,关键模式是以产品的形式图1.一、客户对产品的总体评价120D.R. Kumar Raja,S.Pushpa/Future Computing and Informatics Journal 2(2017)118e 124图二、客户对产品的意见以评级的形式5星级评级。图3. 客户对产品的意见以评级的形式1星评级。图四、False_产品在高评价和令人失望的评论方面的正面情况D.R. Kumar Raja,S.Pushpa/Future Computing and Informatics Journal 2(2017)118e 124121图五、产品的False_Positive情况,即评级较低和满意的评论。从客户的详细评论中获得的功能。在确定了这两个关键字之后,我们将把每个关键字与表中的每个键模式联系起来。从该表中,我们可以轻松地提供产品的功能级别评级。这里也使用传统的启动评级系统来判断产品质量,但这是在功能定位方面。3.1. 要遵循的根据数据集收集产品评论使用任何FP增长算法处理该数据集以获得关键术语和关键模式。基于关联结果,构建特征等级表,其中特征具有其质量(质量是指评级的质量,如好、差、平均)。为表中的关键模式分配与质量相关的词● 生成显示功能级别评级的结果正如我们上面所讨论的,我们必须细化数据集,以识别来自Amazon网站的结构化评论。在提炼过程中,我们将使用关联规则挖掘来收集与产品相关的评论。意见挖掘是从Web中提取意见的过程。意见是个人的私人状态,因此它代表了个人对特定主题/主题/项目的想法、信念、评估、判断和评价意见可以采取客户从朋友,亲戚,甚至用户评论之前或之后购买的产品.意见可以从不同的来源收集,如个人互动,报纸,电视,互联网和许多。意见有三个主要组成部分。 它们是:1. 意见持有者或意见来源2. 表达意见的对象3. 评价和评价,即意见。意见可以用不同的方式表达。以下是一些例子。● Shahid Afridi是一名优秀的球员。● 酒店很贵。● 咖啡很贵,但茶很便宜。随着万维网(WWW)的出现,网络上的内容日益增多,出现了大量的话题讨论和意见。在决策过程中,意见对个人、政府、组织和社会团体都有很大的影响和指导作用。有两种观点句,它们是:1. 结构化句子(Structured Sentences):定义了词汇规则格式的句子可以称为结构化句子[3]。相机对摄影师名词形容词2. 非结构化句子:没有任何定义格式的词汇规则的句子可以被称为非结构化句子。例如:我为我父亲购买了这个产品,购买这个产品的第一个需求是他可以很容易地操作它但一开始他们没有提到任何地方,比如它不适合那些不能操作触摸界面手机的人,然后在购买产品后,它工作正常,但后来它不能有效地工作[3]。图第 六章●●●●122D.R. Kumar Raja,S.Pushpa/Future Computing and Informatics Journal 2(2017)118e 124图第六章算法流程图4. 方法产品的评级应通过评估客户撰写的评论来给出。为了评估评论,我们提出了一个通用算法,它将考虑客户撰写的评论并对产品进行评级。5. FLRRA算法要求:产品评审文件。确保:产品评级。1. 阅读文档。2. 将非结构化文档转换为结构化文档。3. 将文本文档拆分为句子。4. 把句子标记成关键词。5. 消除停止词和标记的令牌使用POS标签。6. 使用POS Tagger标记令牌并识别名词短语。7. 使用词频分布识别频繁出现的名词短语。8. 使用字典挖掘特征描述符和语言模糊限制语。9. 如果术语不在字典中,则检查候选术语的同义词。10. 提取固执己见的短语。11. 返回给定文本的评论和评论分数在对评论数据进行预处理时,我们使用著名的StanfordParser解析了每个数据集中的所有评论文档,该解析器在实践中已经证明在计算文本的语法依赖结构方面表现良好[8]。1. http://mpqa.cs.pitt.edu/lexicons/subjlexicon2. http://liu.cs.uic.edu/download/data3. http://www.amazon.comD.R. Kumar Raja,S.Pushpa/Future Computing and Informatics Journal 2(2017)118e 124123¼¼¼¼¼¼þþ4. http://sifaka.cs.uiuc.edu/wang296/Data/index.html5. http://www.tripadvisor.com6. http://nlp.stanford.edu/software/lexparser.html我们从电子商务网站获得的数据必须经过改进才能与数据一起工作。细化涉及到要转换为合适格式的数据。例如,我们从Amazon获取JSON格式的数据,并将该数据转换为。CSV文件格式系统作为Rapid Miner工具的输入。6. 伪代码{创建要素级别表//表格将包含电子商务网站中所有可用产品的列表。产品名称是我们必须根据我们的偏好给出的名称-给出表格的内容//}其他{//进入基本文件的初始阶段并获取另一个名称}对于(i 0;i a[n];i)//a[n]是网站上提供的产品总数//{利用FP-growth算法对表进行关联规则挖掘。//FP-Growth算法的主要优点是,使用紧凑的数据结构,消除了重复的数据库扫描,并且与Apriori算法[7]相比成本较低//如果Key_Word正常{Rating 5}Else If{关键字错误{评分1.}否则{关键字!好关键词! 坏评级3//其他评级怎么}}}7. 执行为了在任何数据挖掘工具(如Rapid Miner,Weka等)中自动实现该算法,我们需要该工具的完全许可版本。由于大量数据的可用性,我们不可能使用这些工具,即使它们可以免费使用。人工算法在三星Galaxy J7产品上进行了测试,共有8778条评论,并分为两类:正面评论6903条和负面评论1875条。现在来测试这个过程,给出两个5星评级的评论和产品不好的评论,然后令人惊讶的是,我们发现总评论是8781,6905个正面评论和1875个负面评论。在看完这份报告后,复制了所有的评论并手动分析它们,并将它们分为两类,然后我们使用特征级别评论评级算法得到了5974条正面评论和2807条负面评论,并了解到这会导致假正面结果并使客户做出错误的决定。与现有的系统相比,本文提出的算法,我们将得到良好的效果。8. 结果使用的评级系统正面评价负面评价正常评级系统69051875使用FLRRA59742807三星Galaxy J7可用的评论总数为8781,并且没有使用任何算法,现有系统通过使用星级将其分类为6905是正面评 论 , 1875 评 论 是 负 面 评 论 , 这 是 错 误 的 。 使 用FLRRA,同样的8781评论被分类为5974是正面评论和2807是负面评论,这证明现有的评级系统是无效的。9. 结论本文提出了一种新的算法来了解个人对产品某个特征的意见,这将被用来分析产品的特定特征的生产率。它被用作公司对产品和产品特征进行决策的决策策略。我们的方法是有用的,以产生任何产品的功能级别的评级,这将避免假阳性评级的产品与现有的方法,这是正在使用的几乎所有的电子商务网站。引用[1] Kumar Raja DR,Pushpa S,Naveen Kumar BS.“Multidimensionaldistributed opinion extraction for sentiment analysis e anovelApproach ”,InternationalConferenceonAdvancesinElectrical , Electronics , Information ,Communication , andBio-Informatics ( AEEICB16 )978-1-4673- 9745-2 ©2016 IEEE.[2] 上下起伏:建模的视觉演变的时尚趋势与一个-classco ll abor ativeWW W W20 16,Ap ril11e15,20 16,Mon t rr r r'eal,Qu'ebe c,CanadaACM978-1-4503-4143-1/16/04.https://doi.org/10.1145/2872427。 2883037124D.R. Kumar Raja,S.Pushpa/Future Computing and Informatics Journal 2(2017)118e 124[3] [10]杨文,王文,王文.以特征相关性分析于线上行销以提升生产力。I-Manager's J Software Eng 2015年1月和3月;9(3)。[4] Dependently Parsing Schoolat COLING-ACL,Sydney 2006 Joakim N ivreSandraK€ublerUppsalaUn i versityandV€a x€j oUn i v e rsit y,Sweden.Eberhard-K a rlsUn iv ersi€t at T€ubingen,Germa ny.[5] 杨杰,Yecies Brian,Yang H.挖掘中国社交媒体UGC:一个分析豆瓣影 评 和 Yecies 的 大 数 据 框 架 。 大 数 据 杂 志 2016;3 : 3 。https://doi.org/10.1186/s40537-015-0037-9网站。[7] 使用APRIORI和FP增长算法实现Web使用挖掘。Int J Adv NetwAppl2010;01(06).[8] Maas AL,Daly RE,Pham PT,Huang D,Ng AY,Potts C.学习词向量进行情感分析。在:计算语言学协会第49届年会的会议记录:人类语言技术e第1卷,系列。HLT'11。Stroudsburg,PA,USA:Association for Computational Linguistics; 2011. p. 142E 50。
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- StarModAPI: StarMade 模组开发的Java API工具包
- PHP疫情上报管理系统开发与数据库实现详解
- 中秋节特献:明月祝福Flash动画素材
- Java GUI界面RPi-kee_Pilot:RPi-kee专用控制工具
- 电脑端APK信息提取工具APK Messenger功能介绍
- 探索矩阵连乘算法在C++中的应用
- Airflow教程:入门到工作流程创建
- MIP在Matlab中实现黑白图像处理的开源解决方案
- 图像切割感知分组框架:Matlab中的PG-framework实现
- 计算机科学中的经典算法与应用场景解析
- MiniZinc 编译器:高效解决离散优化问题
- MATLAB工具用于测量静态接触角的开源代码解析
- Python网络服务器项目合作指南
- 使用Matlab实现基础水族馆鱼类跟踪的代码解析
- vagga:基于Rust的用户空间容器化开发工具
- PPAP: 多语言支持的PHP邮政地址解析器项目
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功