TAR++:基于TAR重要性的新型过程模型相似性算法

0 下载量 88 浏览量 更新于2024-07-15 收藏 1.32MB PDF 举报
"TAR ++:ANewProcessModelSimilarityAlgorithmBasedontheImportanceofTARs" 在企业中,业务流程模型是三大要素之一,被视为极其重要的资产。有效的过程模型相似性算法对于过程模型检索、聚类和分类至关重要。鉴于现有算法存在的不同缺陷,王书豪等人提出了一种新的基于转换相邻关系(TARs)重要性的过程模型相似性算法——TAR++。TAR++的主要思想是在TARs上添加重要权重,以生成加权TAR集,并重新定义联合和交集操作,从而更准确地描述转换之间的关系。 TAR++算法基于杰卡德系数(Jaccard Coefficient)构建,并利用了加权TAR集。杰卡德系数是一种衡量两个集合相似度的指标,在这里被用来评估两个过程模型的相似程度。通过引入加权TAR集,TAR++能够更好地捕捉到模型中各个转换之间的相对重要性,这对于评估模型的整体相似性具有重要意义。 TAR++算法的实现步骤如下: 1. 首先,识别并提取过程模型中的转换和转换相邻关系(TARs)。转换代表了模型中的活动或决策点,而TARs描述了这些转换之间的连接。 2. 其次,为每个TAR分配一个权重,该权重反映了其在模型中的重要性。这可以通过分析TAR的频率、其连接的转换的重要性,或者通过其他方式来确定。 3. 接着,使用加权TAR集来表示过程模型,其中每个TAR都带有相应的权重值。 4. 定义新的联合和交集操作,这些操作考虑了TARs的权重,而不是简单地计数。 5. 最后,使用加权TAR集的联合和交集来计算两个模型之间的相似度,这通常涉及到杰卡德系数或其他相似度测量方法的扩展形式。 为了验证TAR++算法的有效性和优势,研究者在SAP、中国中车和东方锅炉集团的实际数据集上进行了实验。这些实验证明了TAR++在处理不同类型的业务流程模型时,能够提供更精确的相似性度量,从而提高模型检索、聚类和分类的准确性。 关键词:展开模型、转换相邻关系、重要性权重、杰卡德系数、过程模型相似性、业务流程管理