没有合适的资源?快使用搜索试试~ 我知道了~
International Journal of Information Management Data Insights 1(2021)100011i-Pulse:一种基于NLP的物流组织员工敬业度新方法Rachit Garga,b,Arvind W Kiwelekara,Laxman D Netaka,Akshay Ghodakeb计算机工程系 博士Babasaheb Ambedkar Technical University,Lonere,Dist Raigad(MS)402103,Indiab先进技术和创新中心ATA Freight Line India Pvt. Ltd.,印度浦那aRT i cL e i nf o保留字:员工敬业度物流和深度NLP Pulse调查,1. 介绍a b sTR a cT尽管大多数物流和货运代理组织都以这样或那样的方式声称拥有核心价值观。员工的参与度是一个庞大的结构,几乎涵盖了公司核心环境价值观的每一部分。关于公司与约定之间的关系,的员工。基于研究文献,本文旨在通过实施深度自然语言处理概念,提供一种新的方法来洞察物流组织中的员工参与度。名为IntelligentPulse(i-Pulse)的i-Pulse允许利益相关者在他们的组织中以新的方式思考,帮助他们在员工参与度,保留率和效率方面拥有强大的影响力。这项研究是相应的兴趣,研究人员和从业人员。绿色化产生了迫在眉睫的绿色和可持续物流(G SL)需求。G SL计划引发了全球讨论,在过去十年中,全球行业的运作方式发生了巨大变化,传统的金融、政治和地理界限几乎消失。全球商业环境的这种发展并没有让物流行业受到影响(Bhattacharya,2015年; Winkelhaus和Grosse,2020年)。近年来,通过人工智能和区块链,物流行业的社区正在经历重大变革。物流价值链是公司整个价值链的组成部分(Batta等人,2020年)。供应链类似于实际的金属链。产品生产和交付的每一步都是一个连接,在将概念转化为实际可交付产品的过程中发挥着关键作用。然而,当这一环变弱时,整个链条就会失去力量,或者完全断裂。物流公司是许多其他行业的支柱,事情会以正确的方式和时间。如果没有适当的内部沟通系统,员工可能会感到孤立,从而降低效率和收入。脱节和受挫的工人是供应链中最薄弱的环节之一。精益物流1是关于建立效率,这正是员工工程的全部内容。员工参与的效果(减少流动率,提高效率等)是您希望看到的 在精益物流环境中。日益全球化和工业化-近几十年来,寻求减少外部负面运输条件和提高供应链的效率(Ren等人,2020年)。组织的文化和员工的参与对于新的 考虑到工人多样性的增加,包括各种感知、认知和身体技能,强烈需要创建个性化的、个性化的解决方案(Sgarbossa等人, 2020年)。德勤表示,三年收入的平均增长是具有平均水平的高度敬业度的雇佣组织的2.3倍(Daichendt和Kaplan,2016)。PaulJ.Zak发现,在高信任度公司工作的员工更喜欢他们的工作60%,70%更符合公司目标,并且感觉66%更接近他们的同事(Zak,2017)。如果有持续改进的需要,则需要持续改进。热情洋溢这就是承诺的意义所在当工人们投入工作时,他们就充分地投入到精益物流中。员工参与供应链的好处往往会提高运输链的生产力和效率。这是员工流动的一个重要因素,因为空闲的员工经常感到装备不足、价值被低估和过时。物流领导者如果考虑敬业度的激励并采取措施促进员工的敬业度,也将在长期和短期内受益∗ 通讯作者。电子邮件地址:rachit.garg. gmail.com(R. Garg),cati_5@atafreight.com(A. Ghodake)。1它是一种识别和删除不必要的做法的方法。精益物流提高效率,产生积极的客户参与。https://doi.org/10.1016/j.jjimei.2021.100011接收日期:2020年12月19日;接收日期:2021年3月14日;接受日期:2021年3月14日2667-0968/© 2021作者。由Elsevier Ltd.发布。这是一个CC BY-NC-ND许可证下的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)目录可在ScienceDirect国际信息管理数据见解期刊主页:www.elsevier.com/locate/jjimeiR. Garg,A.W. Kiwelekar,L.D. Netak等人International Journal of Information Management Data Insights 1(2021)1000112供应链中的领导者需要采取措施解决参与问题。然而,行动意味着首先要花时间考虑是什么原因导致脱离接触,然后努力解决根本问题。虽然需要在前端进行研究,但从长远来看,提高员工参与度会产生更好、更有生产力的供应链。研究报告显示,只有14%到30%的员工在工作中(Welbourne,2007)。留住优秀的员工并不是什么难事,尽管让他们保持敬业精神是当今公司面临的最大挑战。管理需求在他们的职业道路上赢得他们的心和思想。在当今充满活力的市场中,员工的努力已被证明是企业成功的关键催化剂。此外,员工的参与可能是物流业务成功的关键因素。参与是提高公司及其利益相关者信誉的关键因素。创新、组织文化、沟通障碍、关系和冲突解决方案是物流组织成功采购的几个参数之一所有这些参数也有助于提高员工在组织中的参与度。敬业的员工可以做得更多,那就是去执行超出预期,并与物流高度相关,或者-组织创新行为。它包括一种促进创新和减少员工沟通障碍的组织文化。员工越投入,他们之间的关系就越紧密。换句话说,员工的参与度直接对应于员工对关系的亲密度。员工敬业度能够深刻影响物流组织中员工的保留和忠诚度。工作满意度通常与员工参与同义,因为两者都涉及员工、工作场所气氛、薪酬和福利。员工参与物流组织的优势,包括将缺勤率降低41%,将营业额降低24%,将安全事故减少70%,有助于短期和长期收益(Post,2020)。员工敬业度是一个动态的术语,影响敬业度的因素很多。因此,有几种方法来鼓励互动,但没有一套适合所有组织。作为传统年度调查的补充,脉冲调查越来越受欢迎,重点关注员工敬业度或员工满意度等主题。脉冲调查和更定期的员工调查是标准的补救措施,频繁的员工工程问题发现广泛的调查。通常是劳动力的比例表现出高度的奉献精神来回答一组特定的问题。技术标准是非常可取的公司开发更广泛的存储库,可以整合调查结果与人力资源管理系统。为了在市场上保持竞争力,组织必须促进员工积极参与,作为为公司获得竞争优势的战略行动。本文探讨了如何提高员工敬业度,一个物流企业通过引入一个新的模式命名为i-Pulse。本文基于深度自然语言处理系统,该系统自动分析数千条脉搏调查评论,以确定对组织最重要的关键字。i-Pulse利用人们的实时数据,为物流领导者提供整体快照公司的福祉,洞察力,以确定挑战和行动方向。本文共分六个部分。第二节通过从文献中识别员工敬业度结构来讨论理论模型。第3节讨论了在物流员工参与中使用NLP的动机。第4节讨论方法的执行。第五、六节讨论本研究的结果与讨论。研究结论载于本文件第7节。2. 文献综述在过去的几年里,员工的参与度一直受到极大的关注。许多人认为,员工可 持 续 性 、 组 织 进 步 和 财 务 效 率 ( Saks , 2006; Shanmugam 和Krishnaveni,2012)。近年来,承诺员工流失已成为一个普遍的问题。然而,关于这个问题的关键学术文献仍然未知;管理层如何能够显著提高员工敬业度相对未知。 随着人们对参与的关注越来越多,也目前,还没有一致性的概念,其贡献是以几种不同的方式操作和衡量的。作者还通过查阅期刊论文、工作论文、教科书、案例研究和其他可公开获得的有关员工敬业度的出版物进行了文献调查(参见图1)。文献中经常交替使用物流和供应链管理(SCM),但这两个不同的微妙。SCM比物流更具战略性,更具操作性(Mitra,2008)。审查还讨论了尚未解决的缺点和问题,指出了应在哪些方面开展进一步调查。该评论试图通过对现有员工敬业度文献的彻底检查和对现有讨论和结论的反思,为当前的理解状态增加价值。缺乏普遍接受的员工敬业度定义是文献中发现的最初挑战之一。由于缺乏对员工敬业度的共识,因此要建立这种结构,它是高度分散的。“员工参与”一词 Macey等人指出了员工敬业度概念在学术和实践中的模糊性。他们还介绍了各种研究人员提出的员工敬业度心理状态之间的混淆。他们还讨论了与心理状态参与、行为参与和特质参与相关的14个前提(Macey和Schneider,2008)。 根据Dalal等人的研究,关于员工敬业度的文献处于混乱状态。他们还更新了Macey和Schneider情感不仅是认知的,也是性格的和行为的(Dalal等人, 2008年)。第一步:从纸到网卡恩在1990年的学术文献中介绍了员工参与的最早概念。Kahn说,敬业度意味着员工在组织角色中既有心理上的,也有身体上的(Kahn,1990)。根据Truss等人在2006年的研究,员工的敬业度是对工作的热情。为了实现和计算员工参与度,他们确定了五个主要组成部分进行分析,即整体参与度、认知参与度、情感参与度、身体参与度和倡导度(Bailey等人,2020年)。员工工作激情的定义是在Zigarmi等人的另一项研究中引入的;员工的工作激情说,工作激情来自于对不同工作和组织环境的定期认知和情感评估。他们还引入了一个工作激情模型,将评估的想法融入员工的工作激情中。他们同意,认知、洞察力和意图这三个组成部分必须整合到员工激情、奉献或满意度的每一个有用的概念它可以通过应用评价结构和认知、理解和意图的要素来实现(Zigarmi等人, 2009年)。敬业是一种积极和令人满意的心态,与强烈的力量感、奉献精神和责任感相联系(Schaufeli和Bakker,2004)。员工对组织的情感和精神承诺定义了员工在工作 中 的 敬 业 度 或 有 效 承 诺 ( Baumruk , 2004; Richman , 2006;Shaw,2005)。事实上,有不同的解释,使它成为一个令人不安的- 评估对员工敬业度的理解程度,因为每项研究都在一个单独的框架下探索员工的参与。 在普遍定义之前,衡量参与度是一项挑战(Ferguson和Carstairs,2005年)。根据R. Garg,A.W. Kiwelekar,L.D. Netak等人International Journal of Information Management Data Insights 1(2021)1000113Fig. 1. 员工工程概念增长的时间轴。Harter等人(2002)指出,员工敬业度和业务成果之间存在决定性的、令人着迷的联系。这些包括员工的绩效和效率、安全性、生产力、存在、维护、盈利能力、客户服务和客户满意度。根据纽曼的说法,员工敬业度是对时间和精力等个人资源的投资。他们还指出,组织支持活动的积极多样性可能明确来自参与(Newman和Harrison,2008)。过去二十年来,航运部门缺乏专业和有经验的人员, 正面临严重的稳态保持问题(Haka等人, 2011年; Lewarn和Francis,2009年)。在海运业中,在各种航运业之间存在相对较高的流动性(Fei等人,2009年)。雇员从一个雇主转到另一个雇主的流动程度很高。这种转变在物流行业的财务影响可能很高,因为组织已经在离职员工身上花费了时间,时间和金钱。根据Mason(2019)的观点,物流服务公司的管理、员工敬业度和忠诚度之间的相互关系是基石。衡量员工敬业度是一个组织的挑战。许多物流公司使用年度员工调查的标准方法作为获得洞察力的测量工具。为了评估一段时间内的模式,调查往往是有益的。许多从业者和咨询公司已经开发了测量员工敬业度的调查方法和定义(Christian等人,2011; Kanste,2011)。 最著名的测量方法之一是盖洛普公司开发的盖洛普工作场所审计(GWA)。这些方法是建立在启发性研究,满意度调查,小组生产力和监督经验(哈特等人,2003年; O 'Boyle和Harter,2013年)。Shuck等人对1009个来源进行了系统回顾,研究了有关员工敬业度的广泛文献。他们概述了奖学金的概念。这项研究还为从业人员提供了指导方针,在确定的程度,giglion(Shuck and Wollard,2010).他还提出了四个基本概念。测量敬业行为的方法:(1)倦怠对立法;(2)需求满足法;(3)满意度工程法;(4)多维法(弗莱彻和罗宾逊,2013;舒克,2011)。(1) 从倦怠-对立法的硬币的积极和消极方面是参与和倦怠。它最终会引导那些更投入,最终在燃尽方面较低,反之亦然(Crawford等人, 2010; Maslach等人,2001年)。承诺包括精力、投入和生产力,而疲劳、挫折和缺乏责任感是解释倦怠的相反因素。从燃尽对立法中采取的步骤往往集中在活化能量源上,这通过所使用的形容词来证明,例如,爆发,力量,激励,警惕,警觉。(2) 满足需求的措施通过需求满足方法开发的措施直接来源于Kahn的理论主张和经验发现“心理参与”研究。Kahn提出,一个人可以进行身体活动、情感活动和认知活动(Kahn,1990)。三个心理维度:充实、稳定和有效对这些生活状态有很大的影响. Maslach等人认为奉献是积极的倦怠分析。他们还建立了职业倦怠的三个主要方面与组织生活的各个领域之间的联系(Maslach和Leiter,1997)。(3) 满意度-参与方法的措施该方法的措施主要旨在改善工作场所或组织生活(Harter等人,2002年)。因此,这种方法是针对管理实践和组织举措的特殊性(MacLeod和Clarke,2011)。(4) 多维方法多维方法是员工敬业度领域的最新突破,起源于Saks这种方法有点类似于需求满足方法,因为它集中于角色表现。然而,它是不同的,因为它区分了工作和组织的重点。Schaufeli等人通过描述与工作相关的福祉,提出了参与的概念。他们还认为倦怠和投入是对立的。倦怠的定义是疲惫(低激活)和愤世嫉俗(低识别)的混合,而投入的特征是活力(高激活)和 奉 献 ( 高 识 别 ) ( Schaufeli 等 人 , 2002 年 ) 。 John- son(Johnson,2004)认为,实施特定的敬业度规则将带来员工敬业度,并使组织有效和盈利。情商为组织带来了据他说,在敬业度中使用规则对公司来说没有任何成本,但可以在公司和员工之间建立联系。另一项单独设计的调查是由一家名为Towers Perrin的专业机构进行的,该调查衡量了敬业度基准并评估了其背景(Perrin,2003年)。他们的调查包括有形和无形的混合有形的元素,从而跟踪员工的观点和态度,以了解驱动吸引力、保留力和参与度的工作经验元素。根据专业公司Prince WaterhouseCoopers(PWC)的定义,雇员的能力是指雇员能够采取行动并运用灵活性以实现业务成果的能力。国际发展维度(DDI)也实施了员工敬业度调查(Wellins等人,2005年)。DDI参与调查的项目说明了实现满意度的方法。 这项调查中的许多项目都精确地测量了工作满意度,R. Garg,A.W. Kiwelekar,L.D. Netak等人International Journal of Information Management Data Insights 1(2021)1000114工作满意度的子维度。罗斯巴德引入了一个九项量表来衡量参与、注意力和吸收的两个组成部分(罗斯巴德,2001)。 在Lee等人2019年的一项最新研究中,他们通过修订137项条款,提出了一种从宏观到微观层面的资源分类法。这些资源具有技术、财务或物理特征、心理、情感或认知特征、条件或能量。作者将这些资源分为五个不同的类别,即(a)组织资源,(b)社会资源,(c)工作资源,(d)家庭资源,(e)个人资源。(Lee等人,2019年)。除了Rothbard(2001)的研究外,Khodakarami和Dirani(2020)最近关于员工敬业度的研究也指出,参与程度因工作部门而异,而且往往因性别而异。结果表明,妇女比男子更致力于他们的承诺。与其他工人阶级相比,技术和合格员工的参与度更高。本研究还表明,参与程度成比例地下降,由于减少知觉的行政支持。文献还定义了以下评估员工敬业度的方法。2.1. One-on-one评估敬业度的一个完美方法是与员工一对一会面。一旦他们知道了自己的重要性,员工就会得到最高的满意度.那些认为雇主真正关心他们成长的员工更有可能参与进来。 对于一个雇主来说,有必要为每个团队成员创造一个专门的工作场所体验(Ketani等人,2016年;Shuck和Wollard,2008年)。一个很好的方法是与每个团队成员定期进行一对一的会议和非正式的聊天,以这些会议提供反馈,并有助于创造这样的体验。一对一有各种好处,如改善互动,识别未来的问题,绩效审查和诊断(Mishra等人, 2014年)。定期安排一对一的物流团队会议,可以实现一致的目标和议程。2.2. 留下/离开面谈收集意见的理想方法是通过与员工进行正式访谈,找出什么鼓励员工参与,什么阻碍他们参与。在大多数组织中,离职面谈相对流行,但当管理者询问已经对工作感到满意的员工以及是什么让他们想留下来时,留下来面谈应该是一个最好的主意。最后的面试可能很棒,但唯一的问题是程序可能太晚了。面试是了解离职原因的一种流行方式,它能让你立即了解员工离职的原因。这些面试也有助于组织留住有价值的员工(雷诺兹,2017)。2.3. eNPS自上个十年以来,各种组织中员工的净晋升分数(Net PromoterScore,简称PSPs)概念就一直存在。 物流和供应链的领导者也开始寻找这个想法,以提高员工的参与度。最简单甚至最有效的方法之一评估敬业度的方法是使用员工为了衡量忠诚度,组织使用这个分数。电子商务与员工的短期意向明确相关(Yaneva等人,2018年)。这是一个衡量员工满意度的指标,作为更重要分析的一部分。物流领导者寻求提供不可协商的客户服务。考虑到Fearon等人(2013年)进行的研究的基础,人们认为,建设性和一致的沟通可以减轻许多问题,gistics。电子采购帮助评估利益相关者在内部采购中的忠诚度,并帮助维持供应商之间的健康关系2.4. 缺勤率衡量员工敬业度的另一个主要指标是衡量员工缺勤率。 这一比率衡量了在一定时期内缺勤的雇员人数。比率越低意味着参与度越高。了解员工缺勤率的模式可能是员工敬业度的良好指标(Soane等人,2013年)。然而,它是一个滞后指标,因为它直接关系到它的优势部分,并以同样的方式对待每一个员工。对于残疾员工等不可避免的情况,接受癌症治疗的员工可能会有更多的短期缺勤(Dewar,2020)。今天:脉搏调查是趋势2.5. 倾向调查脉搏调查是一种新兴的测量物流组织实时振动的方法。这些简短而频繁的调查有利于监控员工敬业度的状况。脉搏调查包括一个或两个问题,这些问题将更频繁地、每两周或每月向员工提出。脉搏测量是保持办公室脉搏恒定的完美方法(Lockwood,2007)。许多物流领导者正在从 传统的 员工参 与方式 转向更突 出的脉 搏调查 (Welbourne ,2016)。脉冲调查正在成为参与监测的首选模式,而不是传统的年度调查,重点是物流组织中的员工参与度。组织不断做出努力,以实现员工敬业度的难以捉摸的目标。鉴于各种尝试,文献显示,只有大约三分之一的员工参与一次。专家表示,敬业度得分的重大变化可能需要数年时间(Burjek,2020)。文献亦显示,每项既定指标均取决于独立研究人员通过各种学术性员工敬业度指标对定义的概念化和解释。这种异质性对确定participation研究的重要性和有效性提出了强烈的挑战。许多物流领导者也在努力从每周或每月脉搏调查收集的大量信息中找到可操作的见解,以提高物流组织中的员工参与度。为了帮助后勤领导者确定组织中脱离的根本原因以及消除它的突破口,需要一种实时的参与测量方法,以提供更深入和更准确的参与条件。这种方法需要一个框架来采取行动脉冲调查结果系统,并补充现有的脉冲调查测量(作家和马利克,2019年)。在过去的几年里,脉搏调查在员工敬业度测量中很流行。文献还显示,许多公司今天寻找下一件事发生在参与领域。因此,选择适当的技术来提高员工的参与度可以提供更强的联系。这项工作旨在制定一种新的衡量方法,包括涵盖拟议定义每个组成部分的项目。它还提供了可操作的见解,以总结和提供员工反馈的感觉。支持人工智能的解决方案可以评估脉搏调查中的数百万条员工评论,以快速总结并提供员工反馈的要点通过识别物流组织中最相关的关键字和短语。2.6. 研究目的及意义该研究的目标是研究自然语言处理在物流组织中的实施,以确定R. Garg,A.W. Kiwelekar,L.D. Netak等人International Journal of Information Management Data Insights 1(2021)1000115非结构化脉搏测量注释数据。让供应链领导者采取适当的行动来平衡信任和参与,从而创造一个敬业的员工队伍。员工的参与得到了从业人员和研究人员的广泛认可。致力于营造氛围的组织从员工的生产力、企业目标的实现、客户忠诚度和人才的保留中获益匪浅。为了理解员工反馈的要点,开发反馈分析模型并采取额外措施为每个人营造更好的工作氛围似乎是有用的,特别是在物流和供应链部门。本研究将从一个物流组织的脉搏调查评论中识别出可量化的见解,这些见解可以激励物流领导者,从而改善员工敬业度的范围。从学术的角度来看,这项研究有助于NLP3. NLP在物流员工参与背后人工智能(AI)及其子集如今已不再是科学概念;相反,它是许多企业的数字化未来。基于人工智能的解决方案今天正在使用,以创造一个繁荣的未来。人工智能技术不再是未来学家的领域,而是任何组织商业模式的组成部分,也是许多商业部门计划中的关键战略因素(Verma等人,2021年)。人工智能超越人类的一些计算密集型、分析性甚至创新性限制的能力(Grover等人,2020年)。随着对效率和性能的影响,人工智能几乎在每个领域都开辟了新的应用领域(Dwivedi等人, 2019年)。组织,特别是人员分析组织,即将采用基于人工智能的解决方案来简化和重新定义其所有主要目标。Parthasarathy等人还提出了一个使用人工智能的框架,以提高认知员工管理系统(CEMS)的性能。 他们的研究表明,基于人工智能的智能助理可以将员工的效率提高高达45%(Parthasarathy和Kar,2020)。简而言之,人工智能是一个广泛应用的技术术语,它使用算法计算将大量数据转化为可操作的洞察力。尚未解决的问题是如何利用如何在组织中应用技术,以实现更高的员工敬业度?组织通过员工的反馈和评论收集数据。这一领域的从业者能否帮助组织从这些数据中获得可操作的见解?员工的评论一般都很长,而且会出现语法错误、拼写错误和俚语。这些评论的数量之多给从业人员带来了相当大的挑战。只有少数组织可以花费数十(如果不是数百)小时手动阅读这些评论并将其分类为可量化的见解。对于那些缺乏这种特权的人来说,将这种反馈转化为有意义的数据集这种需求差距是自然语言处理的创新自然语言处理(NLP)和机器学习(ML)开始发挥作用。 ML和NLP算法可以快速将大量非结构化文本数据转换为可操作的见解。文本分析是一种人工智能技术,通过NLP将非结构化数据转换为结构化信息,以使用机器学习算法加强分析(Kumar et al.,2021年)。这些新兴技术可以为员工情绪、行为和预测行为提供新的见解,或者应用于包含大量书面或非结构化信息的数据。这两个关键人工智能领域的结合决定了哪些员工趋势不满意,哪些不同百分比的员工年龄组不满意。这种方法节省了时间和金钱:它还消除了分析师在分类和解释评论时引入偏见的可能性。NLP使用文本分析来提供对员工情绪的详细洞察,识别问题领域,进行彻底的反馈分析,并评估调查。利用这些见解,物流领导者可以量化和开发一个COM-讨论和鼓励员工参与的员工参与战略Chintalapudi等人的一项研究也显示了文本挖掘和文本分析在航运领域海员情绪分析中的潜力(Chintalapudi等人, 2021年)。此外,NLP与其他数据集甚至其他算法的集成具有巨大的组织潜力。该公司可以结合定量和定性调查数据,以创建准确的意见预测,甚至为物流领导者创建量身定制的基于分析的 参与行动 计划根据 一项研究( Teniwut 和Hasyim ,2020年),当前趋势中最有用的特征之一,可以支持供应链中的重要问题,即帮助物流领导者做出决策的系统在这项研究中,我们提出了一种名为i-Pulse的新方法,使物流领导者能够知道员工旅程的哪一部分将是下一个优先事项。这种方法可以自动从开放的评论文本数据中发现模式、问题和机会,而无需手动标记。• i-Pulse是一款支持人工智能的解决方案,可以从Pulse调查中评估员工反馈意见,通过识别物流组织中最相关的关键字和短语,快速总结并提供员工反馈的实质内容。它还监控关键主题随时间的变化。• i-Pulse能够从评论中理解上下文,并使物流领导者能够快速了解员工的谈话内容。• i-Pulse有效地分析文本评论,并获得实践见解,使组织能够应对最重要的问题和机会。• 自然语言处理允许i-Pulse发现脉搏调查评论文本中的模式和趋势。然后,趋势关键词和短语会自动提交给物流领导者,以制定更强大的员工参与行动计划。4. 实施方法本文所做的工作是在Python中实现的。实验环境由Intel Core i5-4590CPU组成,内存为4 GB,操作系统为Windows 7专业版。对于i-Pulse的实施,从ATA Freight的全球存在收集pulse注释文本数据。图4描绘了实现中具体实施步骤如下:(1) 数据收集:该实验使用ATA Freight全球业务中的员工脉搏调查评论数据集,该数据集是在ATA Freight Line India Pvt Ltd.的先进技术和创新中心(CATI)收集的。在CATI,我们使用简短的调查来收集数据,以快速检查员工对问题或想法的看法。该调查的设计包括敬业度的核心驱动因素,如职业、认可、健康、工作与生活的平衡、与目标的一致性。一旦收集到数据,不建议直接从原始文本到拟合机器学习或深度学习模型。首先,我们必须通过将原始数据传递给一系列在python中实现的过滤器来预处理文本。数据的预处理包括删除数字、停用词、标点符号和降低数据的大小写。一旦数据被清理,它就可用于进一步处理。(2) 评论相关性:通过各种预处理技术清理的数据现在可以使用了。使用文本相似性方法计算每个评论与其他评论的相关性得分。在数学上,通过计算两个向量之间的余弦角,计算两者之间的接近度。同样,注释之间的余弦角可以确定它们的接近程度。通过使用余弦相似度,测量每个语句之间的相似度。很多时候,我们写的评论都是不同的,但从上下文来看,它们听起来是一样的;因此,R. Garg,A.W. Kiwelekar,L.D. Netak等人International Journal of Information Management Data Insights 1(2021)1000116图2. 余弦角和向量空间模型的注释.相似性表示评论之间的相关性。所提出的方法使用单词嵌入方法来查找评论之间的相似性。该方法利用数据流和python接口实现了word2vec算法。word2vec的基础是一个简单的相邻词的概念(参见图2)。word 2 vec通过使用上下文来预测目标词(一种称为连续词袋或CBOW的方法)或通过使用词来预测目标上下文(称为skip-gram)的方式中的任一种来预测基于上下文的术语。如果两个词具有近似相似的邻居,该邻居具有几乎相同的上下文,则这些词可能意味着非常相似或至少相关(Ozer et al.,2018年)。它假设词与词之间的关联派生出一个词的意义。word2vec算法在有大量数据时效果最好的文本数据。大约12 GB的最新维基百科英语文章数据的庞大语料库用于训练,以在语义空间中找到单词产生的单词表示取决于单词在语料库中的出现方式。最新的英文维基百科转储XML数据用于实现。维基百科是一个结构良好的文本数据源的丰富来源,它是免费和容易在线访问。它是一个巨大的信息来源,人类可以期待任何类型的信息,而无需考虑第二个问题。下载的Wikipedia文章数据需要从Wikipedia的XML格式处理为文本格式。Python脚本从Wikipedia数据库转储中提取并我们一直在使用内部多处理来并行工作,并更快地处理转储。维基百科转储于2019年5月9日从https://dumps.wikimedia.org/下载。在构建模型之前,从转储中提取纯文本。(3) 模型训练下一步是从文本中训练word2vec模型。构建genism word2vec模型文件,以从维基百科提取的纯文本中训练英语维基百科模型。这个模型的基础是词嵌入。单词嵌入方法给出了一个向量空间模型,该模型定义了每个单词与另一个单词的上下文(Kenter和de Rijke,2015;Mikolov等人,2013年)。训练模型相对简单。单隐层神经网络 以训练用于当前单词的基于上下文的预测的模型。这里的主要目标是找到隐藏层的权重。这些权重必然是模型试图学习的词向量。获得的学习向量表示嵌入。这些嵌入被认为是描述目标词的一些特征。用于训练单词嵌入的算法来自python库的genism包。该算法是由Google扩展的原始word2vec实现,增加了其他功能。深度学习已经在单词的语义表示方面展示了有希望的结果(Mikolov et al., 2013年)。另为了找到单词之间的相似性,它通常使用单词嵌入方法(Kenter和de Rijke,2015)。 单词嵌入是从广泛的语料库中训练的,通常是语言学的或特定于领域的,以便捕获语料库中所有单词之间的统计联系(Nasir et al.,2021年)。根据Naili等人(2017)的研究,word2vec和GloVe在学习向量表示方面比潜在语义分析(LSA)更好。与Glove相比,word2vec在较小的语义空间维度上提供了最好的词向量表示在实践中,GloVe和Word2Vec都被用来将文本翻译成嵌入,并且都表现出相当的效率。尽管该模型在实际应用中是在维基百科文本上训练的,语料库大约为12 GB,但创建这些嵌入需要大量的时间和资源。Word2Vec通过反复迭代训练语料库来进行渐进的在实践中,Word2Vec使用负样本来替换softmax函数,并使用sigmoid特征对数据进行操作,以加速训练过程。词频-逆文档频率(TF-IDF)方法关注词的形态相似性,但没有把握词的内在含义。潜在狄利克雷分配(LDA)方法通过词重叠来定义主题之间的相似性因此,LDA方法的相似性相对较高(Liu等人,2017年)。TF-IDF用单个值映射每个单词,因此不包含任何含义,而单词嵌入试图捕获单词之间的关系 根据Yin Luo的说法,word 2 vec在完整数据集以及数据集的隐式重印上优于LDA 和 TF-IDF 方 法 ( Esposito 等 人 , 2016 年 ; Yin 等 人 , 2018年)。由Intellica.AI 进行的实验表明,与TF-IDF (Intellica,2019)实现的精度相比,word 2 vec的文本相似度精度更高。(4) 分组:一旦计算出每个评论与每个其他评论的相关性,则基于阈值过滤相关评论对。过滤考虑的阈值为相关性分数的85%。阈值的低值可以给出非常一般的结果,并且阈值的高值可以跳过与每个最相关的术语或短语。该作品表现了一个复杂的多维无向连通图.该图将每个评论视为图的一个节点,并且边是两个评论之间的相关性。评论-1和评论-4之间的边缘意味着它们彼此相关,相关性得分超过85%。下一步是将图修剪成所有连通的分量(Holberg,1992)。这些子图表示相关评论的组,其中组的每个成员(评论)相互之间的相关性超过85%(参考图 3)。R. Garg,A.W. Kiwelekar,L.D. Netak等人International Journal of Information Management Data Insights 1(2021)1000117图三. 表示相关评论的组形式的子图。见图4。 执行过程中的步骤。彼此相似的评论被分组在一起,并且所产生的组大致描述了组内的总体主题、主题和模式。这背后的主要思想是回答问题的评论在一个组是完全或部分相似的,如果他们是相互关联的,在同一主题方面。(5) 从每个组中查找相关关键字关键字描述文档中表达的主要主题。关键词提取是从文本中自动提取最相关的词和表达的过程。它会自动检测可用于表示文本的重要单词。这是从大量非结构化文本数据中获得见解的一种非常有效的方法。关键词是相关主题或学科分类的有效方式(Beliga,2014)。自然语言处理(NLP)技术的出现,使得关键词提取变得有效和可靠.对于本文中的关键字提取,我们使用了具有阻尼的TextRank算法(Mihalcea和Tarau,2004)python环境下的0.85TextRank 是一个基于图形的模型。它是Google PageRank算法的改进TextRank算法比TF-IDF算法具有相对稳定的准确率,而且查准率也优于TF-IDF算法。 由于实现简单、无监督和语言的弱相关性的优点,标准TextRank算法适用于单文本和多文本处理(Pan等人,2019年)。TextRank的重要方面是它给出了一个总体排名的句子,无论是简洁的摘要还是更长,更解释性的摘要,包括超过100个单词。TextRank是一种基于图的算法,用于计算术语的权重在这个图中,节点是一个术语。如果项A与项B有链接,则它表示从A到B的边。在构建整个图之后,Eq. (1)给出了R. Garg,A.W. Kiwelekar,L.D. Netak等人International Journal of Information Management Data Insights 1(2021)1000118||图5. 标签:feedback术语。见图6。最频繁(1-3)和最不频繁(57-59)识别的标签/关键字组合。���(������)=(1 −���)+���∑|1中文(简体)������哪里���∈������(������)���������(������)|员工关心办公环境,特别是团队成员之间最少的三个组合显示• d是阻尼因子,在没有输出链路的情况下,可以设置在0到1之间。• S(Vi)是项i• In(Vi)inbound link of i• Out(Vj)j•电子邮件:info@jiangshi.com��� 出站链接5. 结果上一步的输出为每个组生成标记,每个组都有多个注释,因此该组中的每个注释都被分配了一个相关的标记。评论可能没有这个关键字,但它是相对于评论的,并给出了评论的意义。一旦相关关键词以标签的形式出现 把脉论得,则易见。这完全取决于用例,应用程序可能是无限的。5.1. 基于关键字的注释检索研究为物流领导者提供了关于他们更关心的特定标签或关键词的评论,如健康、生活、管理、态度等。它为他们提供了一个机会,让他们了解员工在谈论什么,以及他们如何采取适当的行动来提高员工的满意度, 例如 ,与反 馈相 关的评 论(参 见图 5)。 图 5显示 了关 键词“feedback”的注释,并表示组织的反馈系统。它为管理层提供了可操作的洞察力,以识别由于反馈管理系统而导致的脱离的根本原因,并突破性地消除它。同样,物流领导者可以识别与其他标签相关的评论并确定原因。5.2. 已识别关键字组合该研究还提供了物流领导人的意见,包含一
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- StarModAPI: StarMade 模组开发的Java API工具包
- PHP疫情上报管理系统开发与数据库实现详解
- 中秋节特献:明月祝福Flash动画素材
- Java GUI界面RPi-kee_Pilot:RPi-kee专用控制工具
- 电脑端APK信息提取工具APK Messenger功能介绍
- 探索矩阵连乘算法在C++中的应用
- Airflow教程:入门到工作流程创建
- MIP在Matlab中实现黑白图像处理的开源解决方案
- 图像切割感知分组框架:Matlab中的PG-framework实现
- 计算机科学中的经典算法与应用场景解析
- MiniZinc 编译器:高效解决离散优化问题
- MATLAB工具用于测量静态接触角的开源代码解析
- Python网络服务器项目合作指南
- 使用Matlab实现基础水族馆鱼类跟踪的代码解析
- vagga:基于Rust的用户空间容器化开发工具
- PPAP: 多语言支持的PHP邮政地址解析器项目
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功