The tea-coffee example shows that high-confidence rules can sometimes be misleading. • This is because the confidence measure ignores the support of the itemset appearing in the rule consequent. • One way to address this problem is by applying a metric known as lift • This metric computes the ratio between • The rule’s confidence and • The support of the itemset in the rule consequent. ( ) ( ) Lift cA B s B → =
时间: 2024-04-01 11:36:23 浏览: 93
美国证券交易委员会起诉特斯拉-起诉书全文(英文版)-3-23页.pdf
茶咖啡的例子说明了高置信度规则有时可能会误导。
这是因为置信度度量忽略了规则后件中出现的项目集的支持度。
解决这个问题的方法之一是应用一种称为提升度的度量。
该度量计算以下两者之比:
- 规则的置信度
- 规则后件中项目集的支持度
提升度公式为:
Lift(A → B) = (support(A ∪ B) / N) / (support(A) / N) × (support(B) / N) / N
其中,support(A ∪ B) 表示同时包含 A 和 B 的交易数,support(A) 和 support(B) 分别表示包含 A 和 B 的交易数,N 表示总交易数。
如果 Lift 大于 1,说明 A 和 B 之间存在正相关关系;如果 Lift 小于 1,说明 A 和 B 之间存在负相关关系;如果 Lift 等于 1,说明 A 和 B 之间相互独立。
阅读全文