修复缺陷日志:Bagging-Recurrent事件插补提升缺失类别事件处理

需积分: 0 0 下载量 197 浏览量 更新于2024-06-13 收藏 2.53MB DOCX 举报
在信息技术领域,研究者们关注于如何有效处理在实际应用中常见的缺陷事件日志,尤其是当这些日志中存在缺失分类事件时。《Bagging Recurrent Event Imputation for Repair of Imperfect Event Log with Missing Categorical Events》这篇论文提出了一个创新的方法来解决这个问题。Bagging(自助采样集成)与Recurrent Event Imputation (REI) 结合,形成了一种新颖的类别事件插补策略。Bagging在统计学中用于降低模型方差,提高泛化能力,而REI则专注于利用事件日志中的结构特征来预测和填补缺失的分类事件。 传统的流程挖掘主要关注流程模型的生成,而对缺失事件的处理并未得到充分重视。然而,缺失事件的处理对于确保流程挖掘分析的准确性和有效性至关重要。作者注意到,尽管有各种高级流程发现算法(如alpha挖掘、模糊挖掘等),如果输入的事件日志质量不高,分析结果仍会受到影响。因此,论文的重点在于提升事件日志质量,特别是通过恢复缺失的分类事件,从而间接提升整个流程挖掘分析的质量。 该方法的工作原理是首先通过学习事件间的关联模式来捕捉事件日志的内在结构,然后使用Bagging技术来增强模型的稳健性,减少单个模型的偏差。在实际应用中,作者使用六个真实数据集进行了对比实验,结果显示,Bagging REI 方法在恢复缺失事件方面的性能显著优于现有方法,从而显著提高了事件日志的完整性,进而提高了流程挖掘分析的精确度和可靠性。 论文强调了流程挖掘中数据质量的重要性,引用了"流程挖掘宣言"的概念,指出数据质量问题直接影响分析结果。通过开发Bagging REI 方法,作者旨在填补现有研究在处理缺失分类事件上的空白,为实际场景中的流程挖掘提供了更有效的解决方案。这不仅有助于企业优化业务流程,还能推动流程挖掘技术在更多领域的广泛应用,比如医疗、IT、金融和物流等。