"流程感知信息系统日志中的轨迹异常检测算法研究与评估"

需积分: 0 1 下载量 62 浏览量 更新于2023-12-29 收藏 1005KB PDF 举报
"本论文讨论了四种用于检测流程感知系统日志中异常的算法。其中一种算法只将在日志中不经常出现的轨迹标记为潜在异常。另外三种算法:阈值、迭代和抽样,都是基于从日志中挖掘流程模型或其子集。这些算法在一个包含1500个人工日志的数据集上进行了评估;" 本文主要讨论了流程感知信息系统日志中轨迹异常检测的四种算法。其中一种算法专门针对那些在日志中出现频率较低的轨迹进行标记,将其视为潜在的异常。而另外三种算法:阈值、迭代和抽样,则是基于对日志中的流程模型或其子集进行挖掘。研究人员在一个包含1500个人工日志的数据集上对这些算法进行了评估。 流程感知信息系统是指可以感知和理解业务流程的信息系统。在这些系统的日志中记录了用户执行各种操作的轨迹,而轨迹的异常往往意味着潜在的问题或风险。因此,开发出有效的算法来检测这些异常轨迹对于保障系统的稳定运行和数据的安全非常重要。 在本文中,研究人员提出了四种算法来解决流程感知信息系统日志中轨迹异常检测的问题。首先,一种基于轨迹频率的算法通过识别那些在日志中出现频率较低的轨迹来标记潜在的异常。这种方法的优势在于可以快速捕捉到那些不常见的异常情况,但也可能产生一些误报。接下来的三种算法则是基于对流程模型或其子集的挖掘来进行异常检测。阈值算法通过设置阈值来识别异常轨迹,而迭代算法则是通过迭代地优化流程模型来挖掘异常情况。最后一种抽样算法则是通过对日志进行抽样来检测异常轨迹。 为了评估这些算法的性能,研究人员使用了包含1500个人工日志的数据集进行了实验。他们对每种算法的精度、召回率和F1分数进行了评估,并比较了它们的性能。实验结果表明,虽然基于频率的算法具有较高的召回率,但精度较低,容易产生误报。相比之下,基于流程模型挖掘的算法在精度和F1分数上表现更好,尤其是迭代算法在准确性和召回率上都取得了较好的平衡。 总的来说,本文提出的四种算法都在流程感知信息系统日志中轨迹异常检测方面取得了一定的效果。然而,每种算法都有其优势和局限性,需要根据具体的应用场景进行选择和调整。未来的研究可以进一步探索如何通过结合多种算法或引入新的技术来提高异常检测的准确性和效率。