没有合适的资源?快使用搜索试试~ 我知道了~
软件影响14(2022)100438原始软件出版物ocpa:用于以对象为中心的流程分析Jan NiklasAdams,Gyunam Park,Wil M.P. van der Aalst过程与数据科学,亚琛工业大学,Ahornstraße 55,52074 Aachen,德国A R T I C L E I N F O保留字:过程挖掘以对象为中心的流程挖掘以对象为中心的Petri网预测性流程监控并发检查性能分析A B标准OCPA是一个Python库,支持以对象为中心的流程挖掘。传统的流程挖掘为单个流程生成见解。然而,许多现实生活中的过程是由多个相互作用的子过程和事件可能涉及多个对象。以对象为中心的流程挖掘通过推广流程挖掘技术,提供了分析多个交互流程的技术。OCPA包含用于以对象为中心的事件日志管理、进程发现、一致性检查、增强和预测性进程监视的算法。OCPA很容易与现有的解决方案集成,因为它支持现有的以对象为中心的事件日志标准,提供了大量的文档,并且可以通过Python包安装程序安装代码元数据当前代码版本1.0.0用于此代码版本的代码/存储库的永久链接https://github.com/SoftwareImpacts/SIMPAC-2022-211Reproducible Capsule的永久链接https://codeocean.com/capsule/7687700/tree/v1法律代码许可证GPL-3.0使用git的代码版本控制系统使用Python的软件代码语言、工具和服务编译要求,操作环境依赖性pandas,numpy,pm 4py,networkx,graphviz如果可用开发人员文档/手册链接https://ocpa.readthedocs.io/技术支持电子邮件niklas. pads.rwth-aachen.de1. 介绍过程挖掘提供了基于过程生成的事件数据来分析过程的技术和算法。在事务视图中,流程的每次执行都会生成一系列事件,描述所执行的活动和相关数据。 事件日志收集不同进程执行的事件序列。从事件日志开始,可以发现不同的见解,通常分为四个领域:(1)流程发现:学习一个模型,该模型涵盖了事件日志中可能的活动序列[1]。(2)一致性检验:检验事件序列是否符合给定的规则或表现出偏差[2]。 (3)过程增强:为过程模型配备有关性能、决策或资源的附加信息[3]。(4)预测过程监控:从事件日志中提取特征,并学习不同目标的预测模型[4]。所有已开发技术背后的一个核心假设是流程的一次执行是一系列事件。然而,这种假设在许多现实情况下并不成立:例如,当分析多个过程及其相互作用或由多个子过程组成的过程时[5]。在现实中遇到的这种过程的一个例子是生产过程,其中许多单独的部件在子过程中生产,然后组装。另一个例子是支持业务流程的ERP系统,其中一个流程执行由与不同操作相关联的多个文档组成。在这些情况下,每个子流程产生一个事件序列。由于事件在序列之间共享,因此行为采用图的形式而不是序列的形式。目前,在这种情况下应用过程挖掘技术的唯一方法是扁平化,即,强制事件的顺序性。扁平化引入了重复事件、不正确的依赖约束和消失事件的问题[6本文中的代码(和数据)已由Code Ocean认证为可复制:(https://codeocean.com/)。更多关于生殖器的信息徽章倡议可在https://www.elsevier.com/physical-sciences-and-engineering/computer-science/journals上查阅。∗通讯作者。电子邮件地址:niklas. pads.rwth-aachen.de(J.N.Adams),gnpark@pads.rwth-aachen.de(G.Park),wvdaalst@pads.rwth-aachen.de(W.M.P.van der Aalst).https://doi.org/10.1016/j.simpa.2022.100438接收日期:2022年9月26日;接收日期:2022年10月15日;接受日期:2022年10月26日2665-9638/©2022作者。由Elsevier B.V.出版。这是一篇开放获取的文章,使用CC BY许可证(http://creativecommons.org/licenses/by/4.0/)。可在ScienceDirect上获得目录列表软件影响杂志 首页:www.journals.elsevier.com/software-impactsJ.N. 亚当斯,G。帕克和W.M.P.van der Aalst软件影响14(2022)1004382图1.一、ocpa中 包 含 的功能概述。以对象为中心的过程挖掘解决了传统过程挖掘技术的局限性,它消除了顺序事件结构的假设,并允许在现实中遇到更一般的基于图的事件结构。 具体地,事件可以与多个对象相关。每个对象代表子流程的实例化.由于一个事件可以与多个对象相关联,因此它可以表示子流程之间的交互点最近,已经引入了解决以对象为中心的过程的四个过程挖掘任务的技术:以对象为中心的过程发现[9],以对象为中心的一致性检查[10],以对象为中心的性能分析[11]和以对象为中心的预测过程监控[12]。到目前为止,还没有统一的平台,以对象为中心的过程挖掘存在。OCPA将所有建议的技术捆绑到一个单一的综合Python库中(参见图①的人。这个库有两个主要的含义:第一,使从业者能够快速部署以对象为中心的流程挖掘,以分析联邦流程或由多个子流程组成的复杂系统。第二,为研究人员提供全面实施的最先进技术,这些技术可用于提出新技术和推进现有技术。在本文的剩余部分中,我们将首先介绍OCPA2. 软件概述OCPA作为GitHub存储库1和通过包安装程序pip提供。2我们提供了核心代码框架,并附有示例数据和示例脚本,用于集成我们的库。大量的文档可以在readthedocs上找到。3本文档为每种算法提供了一组示例。核心代码框架分为事件日志管理、算法和可视化子模块。2.1. 事件日志管理子模块事件日志管理子模块包含存储和访问以对象为中心的事件数据的所有功能。我们允许以三种格式之一导入以对象为中心的事件日志:CSV、JSONOCEL和XMLOCEL4。导入CSV文件时,必须提供有关列映射的信息。包含在以对象为中心的事件日志中的数据可以通过OCEL类访问,从而形成中心第1https://github.com/ocpm/ocpa2https://pypi.org/project/pip/3https://ocpa.readthedocs.io4两者都已在OCEL标准www.ocel-standard.org中定义。这个库的数据存储对象。用户可以访问事件和对象值,以及触发事件日志的更精细的衍生物,例如流程执行、变量和关于这些对象的各种统计信息。为了与其他工具兼容,OCPA支持将OCEL对象导出为JSONOCEL格式。用户可以使用此功能将CSV转换为JSONOCEL。2.2. 算法子模块算法子模块包含了近年来在以对象为中心的过程挖掘中引入的主要算法和技术。从以对象为中心的事件日志开始,可以使用以对象为中心的流程发现、一致性检查、流程增强和预测性监控以对象为中心的流程发现。OCPA使得能够通过两种方式调查以对象为中心的过程中的控制流:过程发现和变体分析。首先,可以按照van derAalst和Berti [9]的一般方法将过程模型发现为以对象为中心的Petri网。第二,用户可以发现控制流变体,遵循Adams等人的算法。与传统流程挖掘中的活动序列相比,每个变体都是活动的有向非循环图。以对象为中心的一致性检查。OCPA支持两种主要的一致性检查技术:评估度量和约束监控。评估指标包括以对象为中心的Petri网相对于以对象为中心的事件日志的精度和适应度[10]。健身 是可重放事件的份额,而精确度量化了该份额事件日志中包含的可能的模型行为。约束监控通过分析以对象为中心的事件日志来评估用户定义的业务约束的违反情况[14]。这样的约束包括控制流约束(例如,活动放置顺序直接跟随对象顺序的发送发票),对象参与约束(例如,活动清除发票的执行应当涉及订单以及发票和货物收据),以及性能约束(例如,清除发票的同步时间,即,准备所有订单、发票和货物收据的时间应少于三天)。以对象为中心的流程增强。 OCPA支持时间和非时间性能测量的以对象为中心的性能分析。时间性能度量包括以对象为中心的性能度量(流时间、同步时间、池化时间和滞后时间)以及传统的性能度量(等待时间、服务时间和逗留时间)。为了计算每个活动的这些度量,我们采用[11]中提出的基于模型的方法J.N. 亚当斯,G。帕克和W.M.P.van der Aalst软件影响14(2022)1004383该方法从以对象为中心的事件日志中发现以对象为中心的Petri网,在模型中重放日志,并计算上述性能度量。非时态性能度量包括对象计数、对象类型计数等。以对象为中心的预测性流程监控。OCPA通过三个主要部分为以对象为中心的预测过程监控提供了基础:特征提取、预处理和特征编码。特征提取和编码已在[12]中介绍。基于以对象为中心的事件日志的图形结构来提取特征,即,特征值准确地描述了现实(例如,基于平面事件日志的特征提取仅为先前活动提供一个值,而以对象为中心的特征提取为每个对象的先前活动提供一个值)。提取的特征可以通过归一化和将数据分割成训练集和测试集来进行预处理。这些可以以三种方式编码:作为表格,序列或图形。所有编码都维护不同级别的以对象为中心的事件数据结构,而图编码保留了大多数结构信息。编码可以用于不同的预测模型,例如,回归(表),LSTM [15](序列)或图神经网络[16](图)。2.3. 可视化子模块可视化子模块支持库中不同对象的可视化。对象中心Petri网的可视化通过GraphViz库提供支持。5除了通过GraphViz进行布局之外,OPCA还提供Petri网可视化的导出和存储。变体图可以变得复杂,包括活动标签、对象类型和对象。因此,已经提出了专用的变体可视化技术[13]。OCPA包括所提出的用于变体的布局算法。该算法提供了活动标签和颜色的二维布局,这是传统变体可视化的扩展。3. 影响概述OCPA总结了以对象为中心的过程挖掘的几个贡献,使得研究人员和实践者能够追求新的研究问题和应用。OCPA的研究基础。OCPA中包含的主要功能已经在过去两年的研究中引入。 从以对象为中心的事件日志及其管理开始[6,17],这些贡献涵盖了以对象为中心的Petri网[9]和变体[13,18]的发现,以对象为中心的评估度量[10]和约束监控[14],以对象为中心的性能分析[11]以及以对象为中心的特征提取和编码[12]。虽然OCPA实现了前面列出的研究论文的功能,但其他研究贡献也在OCPA中得到部分支持。图结构事件数据的哲学在[5,7,8]中出现,形成了OCPA的核心哲学。它还可以轻松集成到建议的解决方案中,用于从信息系统或传统事件日志中提取和创建以对象为中心的事件日志[19,20]。OCPA对当前研究的影响。OCPA为所有过程挖掘任务提供考虑以对象为中心的事件数据的基于图的结构的功能。因此,它能够通过将传统的过程挖掘技术转化为以对象为中心的设置,通过应用图设置来追求新的研究问题利用现有的事件日志管理、流程执行提取、流程发现、模型质量度量、性能分析以及特征提取和编码,可以探索许多新技术这些问题包括但不限于:如何聚类以对象为中心的事件数据?哪些车型https://graphviz.org/最适合以对象为中心的预测过程监控?什么是替代一致性检查技术?OCPA本身已经起到了开发若干工具的基础的作用,例如,���[18][19]这些工具为分析任何以对象为中心的流程提供了通用的用例,无论是w.r.t.频繁执行、性能问题或对违反约束的反应。因此,OCPA PMTK6是使用PM4Py开发的,可以在现有环境中快速实现新算法OCPA对应用流程挖掘的影响。流程挖掘已经应用于分析各种行业领域的业务流程[23]:金融(例如,银行和保险公司)[24],制造业(例如,制药和汽车公司)[25],和服务(例如,医疗保健、政府和电信)。流程挖掘应用程序伴随着Celonis,Minit(现在的Microsoft),Signavio(现在的SAP)或MyInvenio(现在的IBM)等流程挖掘供应商的巨大商业成功。以对象为中心是现实生活中业务流程中无所不在的属性[27]。因此,OCPA支持的各种以对象为中心的过程挖掘技术可以支持过程挖掘在不同行业领域的应用。例如,分析公司内部整个端到端订单处理过程中相互作用的流程集合[28]。此外,以对象为中心的流程挖掘可以应用于生产流程,其中不同的生产组件由对象表示[29,30]。领先的供应商已经准备好支持以对象为中心的事件数据,例如,Celonis(最近推出的ProcessSphere)或Mehrwerk Process Mining。4. 结论本文介绍了OCPA。这个Python库为以对象为中心的事件数据提供了广泛的支持,而无需将它们转换为传统的事件数据。因此,OCPA为以对象为中心的事件数据提供了更准确的流程分析。对所有四个流程挖掘任务的全面支持以及OCPA资金我们感谢亚历山大·冯·洪堡(AvH)基金会对我们研究的支持(批准号:1191945)。竞合利益作者声明,他们没有已知的竞争性财务利益或个人关系,可能会影响本文报告的工作引用[1]Adriano Augusto,Raffaele Conforti,Marlon Dumas,Marcello La Rosa,Fab-rizio Maria Maggi,Andrea Marrella,Massimo Mecella,Allar Soo,Automateddiscovery of process models from event logs : Review and benchmark , IEEETrans.Knowl.DataEng.31(4)(2019)686http://dx.doi.org/10.1109/TKDE.2018. 2841877[2]Josep Carmona , Boudewijn F.van Dongen , Andreas Solti , Matthias伟 -dlich,Conclusion Checking - Relating Processes and Models,Springer,ISBN:978-3-319-99413-0,2018,http://dx.doi.org/10.1007/978-3-319-99414-7.[3]Massimiliano de Leoni,流程增强的基础,见:Process Mining Handbook,见:Lecture Notes in Business Information Processing,vol.448,Springer,2022,pp. 243http://dx.doi.org/10.1007/978-3-031-08848-3_8[4]Fabrizio Maria Maggi,Chiara Di Francescomarino,Marlon Dumas,Chiara Ghi-dini , Predictive monitoring of business processes , in : CAiSE , in : LectureNotes in Computer Science , vol. 8484 , Springer , 2014 , pp. 457-http://dx.doi.org/6 https://pmtk.fit.fraunhofer.de/J.N. 亚当斯,G。帕克和W.M.P.van der Aalst软件影响14(2022)1004384[5]Dirk Fahland, Process mining over multiple behavioral dimensions with eventknowledge graphs , in : Process Mining Handbook , in : Lecture Notes inBusiness Information Processing , vol. 448 , Springer , 2022 , pp. 274http://dx.doi。org/10.1007/978-3-031-08848-3_9。[6]Wil M.P. van der Aalst,以对象为中心的流程挖掘:处理事件数据中的发散和收敛,在:SEFM,Springer,2019年,第10页。3//dx.doi.org/10.1007/978-3-030-30446-1_1网站。[7]张文,等,图数据库中的多维事件数据,数据语义。10(1)(2021)109-http://dx.doi.org/10.1007/s13740-021-[8]Philipp Waibel,Lukas Pfahlsberger,Kate Revoredo,Jan Mendling,从领域知识 的 关 系 数 据 库 中 挖 掘 因 果 过 程 , 2022, CoRR abs/2202.08314, arXiv:2202.08314。[9]王文,等,面向对象Petri网的研究,北京大学出版社,2000。Informaticae 175(1-4http://dx.doi.org/10.3233/FI-[10] Jan Niklas Adams,Wil M.P. van der Aalst,以对象为中心的过程挖掘的精度和适应性,在:ICPM,IEEE,2021,pp. 128http://dx.doi.org/10.1109/[11] Gyunam Park,Jan Niklas Adams,Wil M.P. van der Aalst,OPerA:以对象为中心的 性 能 分 析 , 载 于 : ER , Springer , 2022, pp. 281 http://dx.doi.org/10 。1007/978-3-031-17995-2_20。[12] Jan Niklas Adams,Gyunam Park,Sergej Levich,Daniel 舒斯特Wil M.P. vander Aalst,A framework for extracting and encoding features from object-centriceventdata,CoRRabs/2209.01219(2022)http://dx.doi.org/10.48550/arXiv.2209.01219。[13] Jan Niklas Adams,Daniel Schuster,Seth Schmitz,Günther Schuh,Wil M. P.van der Aalst , 定 义 以 对 象 为 中 心 的 事 件 数 据 的 案 例 和 变 体 , CoRRabs/2208.03235(2022)http://dx.doi.org/10.48550/arXiv.2208.03235。[14] Gyunam Park , Wil M.P. van der Aalst , Monitoring constraints in businessprocessesusingobject-centricconstraintgraphs,CoRR(2022 )http://dx.doi.org/10.48550/arXiv.2210.12080。[15] Sepp Hochreiter , Jürgen Schmidhuber , 长 短 期 记 忆 , 神 经 计 算 。 9 ( 8 )(1997)1735http://dx.doi.org/10.1162/neco.1997.9.8.1735[16] 张文,张文,张文龙.20(1)(2009)61http://dx.doi.org/10.1109/TNN.2008.2005605[17] Anahita Farhang Ghahfarokhi, Gyunam Park, Alessandro Berti, Wil M.P. vander Aalst,OCEL:以对象为中心的事件日志标准,收录于:ADBIS 2021 ShortPapers , Doctoral Consortium and Workshop , Vol. 1450 , 收 录 于 :Communications in Computer and Information Science , Springer, 2021, pp.169 http://dx.doi。org/10.1007/978-3-030-85082-1_16。[18] Jan Niklas Adams,Wil M.P. van der Aalst,OC 100:以对象为中心的过程见解,参 见 : PETRINETS , Springer , 2022 年 , 第 100 页 。 139-http://dx.doi.org/10.1007/978-[19] Adrian Rebmann,Jana-Rebecca Brachse,Han van der Aa,在经典事件日志中发现以对象为中心的数据,用于XES的自动转换到OCEL,在:BPM,Springer,2022,pp. 379-http://dx.doi.org/10.1007/978-[20] Alessandro Berti,Gyunam Park,Majid Rafiei,Wil M.P. van der Aalst,An eventSAP ERP流程挖掘的数据提取方法,见:ICPM研讨会,第433卷,Springer,2021年,255-http://dx.doi.org/10.1007/978-3-030-[21] Gyunam Park,Wil M.P. van der Aalst,使用面向行动的流程挖掘实现组织的数字孪生模型,在:ICPM,IEEE,2021,pp.104//dx.doi.org/10.1109/ICPM53251.2021.9576846网站。[22] Alessandro Berti,J.van Zelst,Wil M.P. van der Aalst,Process mining for python(PM4Py):Bridging the gap between process- and data science,2019,CoRRabs/1905.06169,arXiv:1905.06169。[23] Rafael Accorsi,Julian Lebherz,实践者对流程挖掘采用,事件日志工程和数据挑战的看法,在:流程挖掘手册,在:商业信息处理讲义,第448卷,Springer,2022年,第100页。212http://dx.doi.org/10.1007/978-3-031-08848-3_7[24] Jochen De Weerdt,Annelies Schupp,An Vanderlook,Bart Baesens,业务流程多面分析的流程挖掘-案例研究在一家金融服务机构,Comput。印第安纳64(1)(2013)57//dx.doi.org/10.1016/j.compind.2012.09.010网站。[25] Mahendrawathi ER , Noval Arsad , Hanim Maria Astuti , Renny PradinaKusumawardani,Rivia Atmajaningtyas Utami,流程挖掘的全球制造公司生产计划 分 析 , J.Enterp 。 信 息 管 理31 ( 2 ) ( 2018 )317http://dx.doi.org/10.1108/JEIM-01-2017-0003[26] Ronny Mans,Wil M.P. van der 阿尔斯特,罗布J.B.范沃什,过程最小-ing in Healthcare - Evaluating and Exploiting Operational Healthcare Proces,in:Springer Briefs in Business Process Management,Springer,ISBN:978-3-319-16070-2,2015,http://dx.doi.org/10.1007/978-3-319-16071-9.[27] David Cohn , Richard Hull , Business artifacts : A data-centric approach tomodelingbusiness operations and processes , IEEE Data Eng.Bull.32 ( 3 )(2009)3-9。[28] Günther Schuh,Andreas Gützlaff,Seth Schmitz,Wil M. P. van der Aalst,基于数 据 的 端 到 端 订 单 处 理 过 程 性 能 描 述 , CIRP Ann. 69 ( 1 ) ( 2020 )381http://dx.doi.org/10.1016/j.cirp.2020.03.013[29] Tobias Brockhoff、Merih Seran Uysal、Isabelle Terrier、Heiko Göhner、Wil M.P.van der Aalst,分析多级BOM结构事件数据,载于:ICPM研讨会,第433卷,Springer,2021年,第103页。47-http://dx.doi.org/10.1007/978-[30] 放大图片Rafael Lorenz,Julian Senoner,Wilfried Sihn,Torbjørn H. Netland,使用 流 程 挖 掘 来 提 高 生 产到 库 存 制 造 的 生 产 率 , Int.J.Prod。 Res. 59( 16)(2021)4869http://dx.doi.org/10.1080/00207543.2021.1906460
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- zigbee-cluster-library-specification
- JSBSim Reference Manual
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功