其中456和456将在下面说明。还可以使用两个类型“7/
和 “ / , 但 是 .!0 把 它 们 都 当 作 “ / 看 待 。 注 意
“ 7/ , “ / , “ / , “ / , “ 7/ 这 些 关 键 字 是 区 分 大 小 写 的 , 而
“/:/和“/则不区分。
数值属性
数值型属性可以是整数或者实数,但 .!0 把它们都当作实数看待。
分类属性
分类属性由456列出一系列可能的类别名称并放在花括号中:45
$645-645*6111。数据集中该属性的值只能是其中一种类
别。
例如如下的属性声明说明“/属性有三种类别:“/,“ /和“/。而数
据集中每个实例对应的“/值必是这三者之一。
如果类别名称带有空格,仍需要将之放入引号中。
字符串属性
字符串属性中可以包含任意的文本。这种类型的属性在文本挖掘中非常有用。
示例:
;< !"==7
日期和时间属性
日期和时间属性统一用“/类型表示,它的格式是
4684569
其中46是这个属性的名称,456是一个字符串,来规定该怎样解析和显示日
期 或 时 间 的 格 式 , 默 认 的 字 符 串 是 ;#>5&+($ 所 给 的 日 期 时 间 组 合 格 式 “ yyyy-MM-
ddHH:mm:ss/。
数据信息部分表达日期的字符串必须符合声明中规定的格式要求(下文有例子)。
数据信息
数据信息中“/标记独占一行,剩下的是各个实例的数据。
每个实例占一行。实例的各属性值用逗号“/隔开。如果某个属性的值是缺失值(7
),用问号“ ?/表示,且这个问号不能省略。例如:
&'&'"#!
?,&)(?
字符串属性和分类属性的值是区分大小写的。若值中含有空格,必须被引号括起来。例如
"=="=#2
@@"==7