Mining Compressed Patterns: δ-clustering • Why compressed patterns? • too many, but less meaningful • Pattern distance measure • δ-clustering: For each pattern P, find all patterns which can be expressed by P and their distance to P are within δ (δ-cover) • All patterns in the cluster can be represented by P • Xin et al., “Mining Compressed Frequent-Pattern Sets”, VLDB’05 ID Item-Sets Support P1 {38,16,18,12} 205227 P2 {38,16,18,12,17} 205211 P3 {39,38,16,18,12,17} 101758 P4 {39,16,18,12,17} 161563 P5 {39,16,18,12} 161576 Closed frequent pattern Report P1, P2, P3, P4, P5 Emphasize too much on support no compression Max-pattern, P3: info loss A desirable output: P2, P3, P4 1 2 1 2 1 2 | ( ) ( )|翻译
时间: 2024-03-31 15:38:37 浏览: 20
这段文本是关于一种名为“δ-clustering”的算法,用于挖掘压缩模式。压缩模式是指在大规模数据集中,存在大量的频繁模式,但其中很多模式并不具有实际意义。因此,压缩模式是对这些频繁模式的一种筛选和压缩。
δ-clustering算法利用一种名为“模式距离度量”的方法,对频繁模式进行压缩。具体来说,对于每个模式P,找到所有可以用P表达,并且与P的距离在δ之内的模式(δ-cover)。所有在该聚类中的模式都可以用P来表示。通过这种方法,δ-clustering算法可以从大量的频繁模式中挖掘出具有实际意义的压缩模式。
在文中举例说明了一个频繁模式集合,其中包含了五个模式P1至P5,它们的支持度(support)不同。其中P3是最大的模式,但是其中包含的信息损失较大。相比之下,P2、P3和P4则是更加理想的输出,它们可以更好地压缩模式集合,并且不会损失太多信息。
综上所述,δ-clustering算法通过压缩模式,从而减少了大规模数据集中的频繁模式数量,并且能够挖掘出具有实际意义的压缩模式。
相关问题
Advanced Frequent Pattern Mining • Pattern Mining: A Road Map • Pattern Mining in Multi-Level, Multi-Dimensional Space • Mining Multi-Level Association • Mining Multi-Dimensional Association • Mining Quantitative Association Rules • Mining Rare Patterns and Negative Patterns • Constraint-Based Frequent Pattern Mining • Mining Colossal Patterns • Mining Compressed Patterns • Pattern Exploration and Application • Sequential Pattern Mining
你的问题是关于频繁模式挖掘的吗?这些主题确实是频繁模式挖掘领域的一些重要研究方向。频繁模式挖掘是数据挖掘领域的一个重要分支,它的目标是从数据集中挖掘出频繁出现的模式。这些模式可以帮助我们了解数据集的特征、规律和关系,从而对数据进行更深入的分析和理解。这些研究方向主要涉及到多维、多层次、序列和约束等方面的模式挖掘,以及对挖掘结果的压缩、探索和应用等方面的研究。
Advanced Frequent Pattern Mining • Pattern Mining: A Road Map • Pattern Mining in Multi-Level, Multi-Dimensional Space • Mining Multi-Level Association • Mining Multi-Dimensional Association • Mining Quantitative Association Rules • Mining Rare Patterns and Negative Patterns • Constraint-Based Frequent Pattern Mining • Mining Colossal Patterns • Mining Compressed Patterns • Pattern Exploration and Application • Sequential Pattern Mining翻译成中文,解释
高级频繁模式挖掘 • 模式挖掘:一条路线图 • 多层次、多维度空间中的模式挖掘 • 挖掘多层次关联 • 挖掘多维度关联 • 挖掘定量关联规则 • 挖掘稀有模式和负面模式 • 基于约束的频繁模式挖掘 • 挖掘巨型模式 • 挖掘压缩模式 • 模式探索和应用 • 顺序模式挖掘
这些研究方向主要是针对频繁模式挖掘领域的一些重要问题进行探索和研究的。其中包括多维、多层次、序列等方面的模式挖掘,以及对挖掘结果的压缩、探索和应用等方面的研究。具体包括挖掘多层次、多维度关联、定量关联规则,以及稀有模式和负面模式的挖掘,还包括基于约束的频繁模式挖掘、巨型模式的挖掘和压缩模式的挖掘等。这些方法和技术可以帮助我们更好地理解数据的特征和规律,对数据进行更深入的分析和挖掘,从而为实际应用提供更有价值的信息和支持。