没有合适的资源?快使用搜索试试~ 我知道了~
首页SVM guide 中文版
资源详情
资源评论
资源推荐

LibSVM 分类的实用指南
译者注:简单翻译了台湾林智仁教授的文章《A Practical Guide to Support Vector Classification》,
未经作者同意,没有版权;同时翻译仅供自己学习之用,不严谨,有错误,还请大家指出。
原文地址:http://www.csie.ntu.edu.tw/~cjlin/。译者博客:http://blog.sina.com.cn/netreview。
摘要
SVM(support vector machine)是一项流行的分类技术。然而,初学者由于不熟悉 SVM,常
常得不到满意的结果,原因在于丢失了一些简单但是非常必要的步骤。在这篇文档中,我们
给出了一个简单的操作流程,得到合理的结果。(译者注:本文中大部分 SVM 实际指的是
LibSVM)
1 入门知识
SVM 是一项非常实用的数据分类技术。虽然 SVM 比起神经网络(Neural Networks)要
相对容易一些,但对于不熟悉该方法的用户而言,开始阶段通常很难得到满意的结果。这里,
我们给出了一份指南,根据它可以得到合理结果。
需要注意,此指南不适用 SVM 的研究者,并且也不保证一定能够获得最高精度结果。
同时,我们也没有打算要解决有挑战性的或者非常复杂的问题。我们的目的,仅在于给初学
者提供快速获得可接受结果的秘诀。
虽然用户不是一定要深入理解 SVM 背后的理论,但为了后文解释操作过程,我们还是
先给出必要的基础的介绍。一项分类任务通常将数据划分成训练集和测试集。训练集的每个
实例,包含一个“目标值(target value)”(例如,分类标注)和一些“属性(attribute)”(例
如,特征或者观测变量)。SVM 的目标是基于训练数据产出一个模型(model),用来预测只
给出属性的测试数据的目标值。
给定一个训练集,“实例-标注”对,
,
支持向量机需要解决如下的优化问题:
在这里,训练向量 xi 通过函数Φ 被映射到一个更高维(甚至有可能无穷维)空间。SVM
在这个高维空间里寻找一个线性的最大间隔的超平面。C>0 是分错项的惩罚因子(penalty
parameter of the error term)。
被称之为核函数(kernel function)。新
的核函数还在研究中,初学者可以在 SVM 书中找到如下四个最基本的核函数:(线性、多项
式、径向基函数、S 型)


















安全验证
文档复制为VIP权益,开通VIP直接复制

评论0