Mining Quantitative Associations Techniques can be categorized by how numerical attributes, such as age or salary are treated 1. Static discretization based on predefined concept hierarchies (data cube methods) 2. Dynamic discretization based on data distribution (quantitative rules, e.g., Srikant & Agrawal@SIGMOD’96) 3. Clustering: Distance-based association (e.g., Miller & Yang@SIGMOD’97) • One dimensional clustering then association 4. Deviation: (such as Aumann & Lindell@KDD’99) Gender = female => Wage: mean=$7/hr (overall mean = $9) Z检验(或t检验)翻译解释
时间: 2024-04-01 14:31:32 浏览: 116
使用商业分析和数据驱动的决策为学生的职业生涯做好准备-研究论文
这段话讨论了挖掘定量关联的技术,根据如何处理数字属性(如年龄或工资)可以分为以下几种类型:
1. 基于预定义概念层次结构的静态离散化方法(数据立方体方法);
2. 基于数据分布的动态离散化方法(定量规则),例如Srikant & Agrawal在SIGMOD'96上提出的方法;
3. 聚类方法:基于距离的关联方法,例如Miller & Yang在SIGMOD'97上提出的方法,可以先进行一维聚类,然后进行关联;
4. 偏差方法:例如Aumann & Lindell在KDD'99上提出的方法,可以根据性别为女性的人的平均工资和总体平均工资进行比较,使用Z检验(或t检验)来检查两者之间的差异。
其中,Z检验是一种用于检验样本均值与总体均值之间是否存在显著差异的统计方法,适用于样本容量较大的情况;t检验则适用于样本容量较小的情况。
阅读全文