Multi-level Association: Flexible Support and Redundancy filtering • Flexible min-support thresholds: Some items are more valuable but less frequent • Use non-uniform, group-based min-support • E.g., {diamond, watch, camera}: 0.05%; {bread, milk}: 5%; … • Redundancy Filtering: Some rules may be redundant due to “ancestor” relationships between items • milk ⇒ wheat bread [support = 8%, confidence = 70%] • 2% milk ⇒ wheat bread [support = 2%, confidence = 72%] The first rule is an ancestor of the second rule • A rule is redundant if its support is close to the “expected” value, based on the rule’s ancestor翻译解释
时间: 2024-04-01 13:31:40 浏览: 48
TMR_CNT_SET.rar_PCI-Express_pci_site:www.pudn.com_tmr
多层次关联规则:灵活的支持度和冗余过滤 • 灵活的最小支持度阈值:某些项更有价值但不太频繁 • 使用非均匀、基于组的最小支持度 • 例如,{钻石、手表、相机}:0.05%;{面包、牛奶}:5%;… • 冗余过滤:一些规则可能由于项之间的“祖先”关系而变得冗余 • 牛奶 ⇒ 小麦面包[支持度=8%,置信度=70%] • 2% 牛奶 ⇒ 小麦面包[支持度=2%,置信度=72%]第一个规则是第二个规则的祖先 • 如果一条规则的支持度接近其祖先规则的“预期”值,则该规则被认为是冗余的。
在多层次关联规则挖掘中,为了更好地挖掘不同层次之间的关联规则,我们需要采用灵活的支持度设置方法。这些方法通常包括使用非均匀、基于组的最小支持度阈值,以便更好地适应不同层次的项的支持度变化。例如,如果我们挖掘的是{钻石、手表、相机}这样较高层次的项集,则我们可以将其对应的最小支持度设置为0.05%;而对于较低层次的项集如{面包、牛奶},我们可以设置相对较高的最小支持度,比如5%。
此外,在挖掘多层次关联规则的过程中,我们还需要考虑冗余过滤的问题。由于不同层次之间的项之间存在“祖先”关系,因此有些规则可能会被其祖先规则覆盖或者被认为是冗余的。例如,如果我们已经挖掘出了牛奶 ⇒ 小麦面包这条规则,那么2% 牛奶 ⇒ 小麦面包这条规则就可以被认为是冗余的,因为前者已经包含了后者的信息。因此,我们需要对挖掘出的规则进行冗余过滤,以提高规则的准确性和可解释性。
阅读全文