association attributes
时间: 2024-05-18 19:08:25 浏览: 20
关联属性(Association Attributes)是指在关联关系中,与关联的两个类相关联的属性。它们描述了两个类之间的关联关系的特征或者约束。关联属性可以存在于关联类中,也可以存在于关联的两个类中。
关联属性可以用来描述关联的两个类之间的关系,例如,一个学生和一个课程之间的关联可以有一个关联属性"成绩",用来表示学生在该课程中的成绩。
关联属性可以具有不同的特性,例如,它可以是单值属性(只能有一个值),也可以是多值属性(可以有多个值)。此外,关联属性还可以具有约束条件,例如,一个学生和一个课程之间的关联属性"成绩"可能有一个约束条件,要求成绩必须在0到100之间。
总结一下,关联属性是描述关联关系的特征或者约束的属性。它可以存在于关联类中,也可以存在于关联的两个类中。
相关问题
Mining Quantitative Associations Techniques can be categorized by how numerical attributes, such as age or salary are treated 1. Static discretization based on predefined concept hierarchies (data cube methods) 2. Dynamic discretization based on data distribution (quantitative rules, e.g., Srikant & Agrawal@SIGMOD’96) 3. Clustering: Distance-based association (e.g., Miller & Yang@SIGMOD’97) • One dimensional clustering then association 4. Deviation: (such as Aumann & Lindell@KDD’99) Gender = female => Wage: mean=$7/hr (overall mean = $9) Z检验(或t检验)翻译解释
这段话讨论了挖掘定量关联的技术,根据如何处理数字属性(如年龄或工资)可以分为以下几种类型:
1. 基于预定义概念层次结构的静态离散化方法(数据立方体方法);
2. 基于数据分布的动态离散化方法(定量规则),例如Srikant & Agrawal在SIGMOD'96上提出的方法;
3. 聚类方法:基于距离的关联方法,例如Miller & Yang在SIGMOD'97上提出的方法,可以先进行一维聚类,然后进行关联;
4. 偏差方法:例如Aumann & Lindell在KDD'99上提出的方法,可以根据性别为女性的人的平均工资和总体平均工资进行比较,使用Z检验(或t检验)来检查两者之间的差异。
其中,Z检验是一种用于检验样本均值与总体均值之间是否存在显著差异的统计方法,适用于样本容量较大的情况;t检验则适用于样本容量较小的情况。
Mining Multi-Dimensional Association • Single-dimensional rules: buys(X, “milk”) ⇒ buys(X, “bread”) • Multi-dimensional rules: ≥ 2 dimensions or predicates • Inter-dimension assoc. rules (no repeated predicates) age(X,”19-25”) ∧ occupation(X,“student”) ⇒ buys(X, “coke”) • hybrid-dimension assoc. rules (repeated predicates) age(X,”19-25”) ∧ buys(X, “popcorn”) ⇒ buys(X, “coke”) • Categorical Attributes: finite number of possible values, no ordering among values—data cube approach • Quantitative Attributes: Numeric, implicit ordering among values— discretization, clustering, and other approaches翻译解释
这段话是讨论多维关联挖掘的内容。在单维规则中,我们只考虑一个谓词,例如“买牛奶就买面包”。而在多维规则中,我们考虑两个或多个谓词之间的关联,例如“年龄在19-25岁且职业是学生的人会买可乐”。
在多维规则中,可以存在跨维度的关联规则,其中没有重复的谓词。而在混合维度关联规则中,可能存在重复的谓词。
在分类属性中,属性值是有限的,没有排序。可以使用数据立方体方法来处理。而在定量属性中,属性值是数字,有隐含的排序。可以使用离散化、聚类等方法来处理。