ARFF文件格式

Attribute -Relation File Format (ARFF)

此文档翻译自http://www.cs.waikato.ac.nz/~ml/weka/arff.html。文档写的比较粗糙,敬请原谅。

可以推荐一篇文档写的还不错:http://www.cnblogs.com/htynkn/archive/2012/03/30/weka_2.html

1ARFF 头章节包括关系声明和属性声明

关系声明(@ralation Declaration

关系声明在ARFF文件的第一行定义。格式如下:

@relation <ralation-name>

<ralation-name>是一个字符串。如果名字包含空格,那么这个字符串必须加引号。

属性声明(The @attribute Decarations

属性声明是以一个有序的属性陈列的形式表述的。数据中的每一个属性都有它自己的@attribute声明,以确保独立的定义那个属性和它的数据类型。

@attribute声明的格式为

@attribute <attribute-name> <datatype>

此处,<attribute-name>必须以字母开头。如果名字中包含空格,那么整个名字必须加引号。

<datatype> 可以是以下wekaversion 3.2.1)包含的任意的数据形式

  • numeric

  • <nominal-specification>

    这种类型主要标注类别名称

  • string

  • date [<date-format>]

2、然后就是ARFF 数据章节也就是数据部分@data Declaration

数据声明是以@data作为一个单独的行来分割文件的。


下面给出一个ARFF 文件格式的例子

% 1. Title: Iris Plants Database
   % 
   % 2. Sources:
   %      (a) Creator: R.A. Fisher
   %      (b) Donor: Michael Marshall (MARSHALL%PLU@io.arc.nasa.gov)
   %      (c) Date: July, 1988
   % 
   @RELATION iris

   @ATTRIBUTE sepallength  NUMERIC
   @ATTRIBUTE sepalwidth   NUMERIC
   @ATTRIBUTE petallength  NUMERIC
   @ATTRIBUTE petalwidth   NUMERIC
   @ATTRIBUTE class        {Iris-setosa,Iris-versicolor,Iris-virginica}

The Data of the ARFF file looks like the following:

   @DATA
   5.1,3.5,1.4,0.2,Iris-setosa
   4.9,3.0,1.4,0.2,Iris-setosa
   4.7,3.2,1.3,0.2,Iris-setosa
   4.6,3.1,1.5,0.2,Iris-setosa
   5.0,3.6,1.4,0.2,Iris-setosa
   5.4,3.9,1.7,0.4,Iris-setosa
   4.6,3.4,1.4,0.3,Iris-setosa
   5.0,3.4,1.5,0.2,Iris-setosa
   4.4,2.9,1.4,0.2,Iris-setosa
4.9,3.1,1.5,0.1,Iris-setosa
原文地址:https://www.cnblogs.com/7899-89/p/3514510.html