标称属性(Nominal Attribute)的值是一些符号或事物的名称。每个值代表某种类别、编码或状态,因此又可称为是分类的(Categorical)。
时间: 2024-02-26 16:54:14 浏览: 29
是的,标称属性(Nominal Attribute)通常用于表示某个事物或对象的名称、类别、编码或状态等,其取值是一些符号或事物的名称,每个值代表某种类别、编码或状态,因此也被称为分类属性(Categorical Attribute)。标称属性的取值通常是有限的,且取值之间没有大小或顺序之分。例如,在一个学生信息数据集中,学生的性别、所在班级、出生地等属性就是标称属性。对于标称属性,常用的数据分析方法包括频数统计、交叉列联表分析等。
相关问题
weka怎样删除nominal为0的值
在Weka中,可以通过使用Filter来删除nominal为0的值。具体步骤如下:
1. 打开数据集,并选择要操作的属性。
2. 选择 "Filter" 选项卡,然后选择 "unsupervised.attribute",再选择 "RemoveUseless"。
3. 在 "RemoveUseless" 对话框中,选择 "Nominal" 类型属性,并在 "Minimum number of distinct values" 选项中输入 "1"。
4. 单击 "OK" 按钮,然后保存数据集。
这样就可以删除nominal为0的属性值。
计算鸢尾花两组数据的相异矩阵(包括符号型属性,数值型属性之间)
鸢尾花数据集包含4个数值型属性(花萼长度、花萼宽度、花瓣长度、花瓣宽度)和1个符号型属性(鸢尾花种类),因此可以计算出5x5的相异矩阵,其中对于符号型属性使用nominal相异度,对于数值型属性使用numeric相异度。以下是计算方法:
1. 对于符号型属性(鸢尾花种类),使用nominal相异度计算,相同则为0,不同则为1。
2. 对于数值型属性(花萼长度、花萼宽度、花瓣长度、花瓣宽度),使用numeric相异度计算,计算公式为:(|x1 - x2|)/(max - min),其中x1和x2分别为两组数据的属性值,max和min为该属性在全部数据中的最大值和最小值。
按照上述方法计算出各个属性之间的相异度,填入相异矩阵即可。需要注意的是,相异矩阵是对称的,因此只需要计算其中一半即可。