svm特征

svm特征格式:<label><index1>:<value1><index1>:<value1>....

  其中<label> 是训练数据集的目标值,对于分类,它是标识某类的整数(支持多个类);对于回归,是任意实数。<index> 是以1开始的整数,可以是不连续的;<value>为实数,也就是我们常说的自变量。

  这里面一个词<index1>:<value1>代表一维,如果要处理的某件事中有很多词是在同一维的比如训练人的特征,有身高,体重...则可以:

1 1:170 2:56 .......

-1 1:140 2:34 ......

不同行里面的特征放在同一样的维度中

  如果要处理的事件中特征之间没有关系,比如垃圾短信的特征,顾客,贷款......则要:

1 1:特征1 2:特征2 ......9:特征9

-1 10:特征10 11:特征11.....100:特征100

第二行相当于前9维特征都设置成0,在这个例子里面特征维度是100,相当于在第一行里地10维以后的维度中的特征都设置成了0,即每一行的特征都是100维

原文地址:https://www.cnblogs.com/fclbky/p/4914031.html