用 LIBSVM 做回归和预测的步骤
下载 、 和 。我用的版本分别是:
(),(),()。注意:
一定要用 版, 版的有
修改训练和测试数据的格式(可以自己用 编个小程序):
目标值 第一维特征编号:第一维特征值 第二维特征编号:第二维特征值
例如:
表示训练用的特征有两维,第一维是 ,第二维是 ,目标值是
注意:训练和测试数据的格式必须相同,都如上所示。测试数据中的目标值是
为了计算误差用
分别使用 中的 !"# 版本的工具 $%& 进行训练
和测试数据的归一化,%& 进行模型训练,"$& 进行
预测
()$%& 的用法:$%&'%&'%$%"
默认的归一化范围是(-,),可以用参数* 和* 分别调整上界和下
届+'%& 是输入特征文件名
输出的归一化特征名为 '%$%"
()%& 训练模型
我习惯写个批处理小程序,处理起来比较方便。例如 ,%% 中训练语
句为:
%&**----***$-*-..
'%$%"
训练得到的模型为 '%$%""
具体的参数含义可以参考帮助文档。这里* 是选择 /01 的类型。对于回归来
说,只能选 或者 , 表示 *$+ 表示
*$。* 是选择核函数,通常选用 234 核函数,
原因在“5%$$%"$$%6$%7中已经简单介绍
过了。* 尽量选个比较小的数字。需要仔细调整的重要参数是*$ 和*。除非用
" 来搜索最优参数,否则只能自己慢慢试了。
用 " 搜索最优参数的方法如下:
&"*%89/019*9
#"#9%&*:9#9&*$*
-+-+**-+-+**-+-+*-**89/019
*9#"#9'%$%"
",'%%%
评论4