![](https://csdnimg.cn/release/download_crawler_static/3206484/bg3.jpg)
图 1 所示的二维表格存储在如下的 ARFF 文件中。这也就是 WEKA 自带的“weather.arff”文件,在 WEKA
安装目录的“data”子目录下可以找到。
Code:
% ARFF file for the weather data with some numric features
%
@relation weather
@attribute outlook {sunny, overcast, rainy}
@attribute temperature real
@attribute humidity real
@attribute windy {TRUE, FALSE}
@attribute play {yes, no}
@data
%
% 14 instances
%
sunny,85,85,FALSE,no
sunny,80,90,TRUE,no
overcast,83,86,FALSE,yes
rainy,70,96,FALSE,yes
rainy,68,80,FALSE,yes
rainy,65,70,TRUE,no
overcast,64,65,TRUE,yes
sunny,72,95,FALSE,no
sunny,69,70,FALSE,yes
rainy,75,80,FALSE,yes
sunny,75,70,TRUE,yes
overcast,72,90,TRUE,yes
overcast,81,75,FALSE,yes
rainy,71,91,TRUE,no
需要注意的是,在 Windows 记事本打开这个文件时,可能会因为回车符定义不一致而导致分行不正常。
推荐使用 UltraEdit 这样的字符编辑软件察看 ARFF 文件的内容。
下面我们来对这个文件的内容进行说明。
识别 ARFF 文件的重要依据是分行,因此不能在这种文件里随意的断行。空行(或全是空格的行)将被忽
略。
以“%”开始的行是注释,WEKA 将忽略这些行。如果你看到的“weather.arff”文件多了或少了些“%”开始
的行,是没有影响的。
除去注释后,整个 ARFF 文件可以分为两个部分。第一部分给出了头信息(Head information),包括了
对关系的声明和对属性的声明。第二部分给出了数据信息(Data information),即数据集中给出的数据。
从“@data”标记开始,后面的就是数据信息了。