台湾大学机器学习技法：寻找最优分类超平面

需积分: 9 50 浏览量更新于2024-07-17 1 收藏 19.16MB PDF 举报

"这篇笔记来自台湾大学的机器学习课程，主要讨论了线性分类和大间隔超平面的概念，以及在面对多个可行的分类边界时如何选择最优的分类器。笔记中提到了Pocket算法用于线性可分情况下的分类，并探讨了分类边界的稳健性和对噪声的容忍度，强调了最大化间隔的重要性。" 在机器学习领域，线性分类是一种基础且实用的技术，特别是在处理二维或高维数据时。台湾大学的机器学习技法笔记中提到的"Linear Classification"，即线性分类，是指通过构建一个超平面（在二维空间中是一条直线，在更高维度中是超平面）来分割数据，将正类和负类分开。在这种情况下，Perceptron Learning Algorithm (PLA) 和 Pocket Algorithm 是常用的优化策略，它们能够迭代地更新超平面以减少错误分类。 "Large-Margin Separating Hyperplane"（大间隔超平面）是线性分类中的一个重要概念。它不只是寻找能够将数据集正确分开的超平面，而是寻找一个具有最大边距（margin）的超平面。边距是指从最近的正例点到超平面的距离，同时也指从最近的负例点到超平面的距离。当数据线性可分时，可能存在多个能够正确分类数据的超平面，但大间隔超平面更受青睐，因为它具有更好的泛化能力。笔记中通过直观的示例解释了为何选择大间隔超平面。当样本点距离分类线越远，分类器对噪声或测量误差的容忍度越高，这意味着分类器更稳健，不容易因为数据的小偏差而误分类。这种对噪声的容忍度可以理解为每个样本点周围的“安全区域”，也就是样本点在保持正确分类的情况下可以允许的误差范围。大间隔的超平面使得这个“安全区域”更大，从而提高模型的鲁棒性，减少了过拟合的风险。在实际应用中，寻找最大间隔的超平面通常可以通过支持向量机（SVM）实现，这是一种优化方法，它寻找能够最大化类别间隔的支持向量（离超平面最近的点）。SVM通过构建软间隔（允许一定程度的误分类）来处理非线性可分情况，进一步增强了模型的泛化能力。机器学习中的大间隔思想是优化分类器性能的关键，它有助于在训练数据有限且存在噪声的情况下，构建出具有良好泛化性能的模型。台湾大学的这份笔记深入浅出地解释了这一核心概念，对于理解和应用线性分类技术是非常有价值的。

值

得

注

意

的

是

，

计

算

值

，

时

，

有

成

立

。

正

好

表

示

的

是

该

点

在

SVM

分

类线

上，

即

fatboundary

。

也

就

是

说

，

满

足

的

点

一

定

落

在

fatboundary

上，

这

些

点

就

是

SupportVector

。

这

是

一个

非

常

有

趣

的

特

性

。

MessagesbehindDualSVM

回

忆

一下，上一

节

课

中

，

我

们

把

位于

分

类线

边

界

上

的

点

称

为

supportvector

（

candidates

）

。

本

节

课

前

面

介

绍

了

的

点

一

定

落

在

分

类线

边

界

上，

这

些

点

称

之为

supportvector

（

注

意

没

有

candidates

）

。

也

就

是

说

分

类线

上

的

点

不一

定

都

是

支

持

向

量

，

但

是

满

足

的

点

，一

定

是

支

持

向

量

。

只

由

的

点

决

定

，

根

据

部

分

推

导

的

和

的

计

算

公

式

，

我

们

发

现

，

和

仅

由

即

的

点

决

定

，

简

化

了

计

算

量

。

这

跟

我

们

节

课

介

绍

的

分

类线

只

由

“

胖

”

边

界

上

的

点

所

决

定

是

一个

道

理

。

也

就

是

说

，

样本

点

可

以

分

成

两

类

：一

类

是

support vectors

，

通过

support vectors

可

以

求

得

fattest hyperplane

；

另

一

类

不

是

support

vectors

，

对

我

们

求

得

fattesthyperplane

没

有

影

响

。

αn

yn(wTzn+b)=1

( +

) = 1

yn(wTzn+b)=1

( +

) = 1

αn

其

中

是

空

间

中

特

征

向

量

的

内

积

。

所

以

，与

的

内

积

的

复

杂

度

由

原

来

的

变

成

，

只

与

空

间

的

维

度

有

关

，

而

与

空

间

的

维

度

无

关

，

这

正

是

我

们

想

要

的

！

至

此

，

我

们

发

现

如

果

把

特

征

转

换

和

空

间

计

算

内

积

这

两个

步

骤

合

并

起

来

，

有

可

能

会

简

化

计

算

。

因

为

我

们

只

是

推

导

了二

阶

多

项

式

会

提

高

运

算

速

度

，

这

个

特

例

并

不

具

有

一

般

推

论

性

。

但

是

，

我

们

还

是

看

到

了

希

望

。

我

们

把

合

并

特

征

转

换

和

计

算

内

积

这

两个

步

骤

的

操

作

叫

做

KernelFunction

，

用

大

写

字

母

表

示

。

例

如

刚刚

讲

的

二

阶

多

项

式

例

子

，

它

的

kernelfunction

为

：

有

了

kernelfunction

之

后

，

我

们

来

看看

它

在

SVM

里

面

如

何使

用

。

在

dualSVM

中

，

二

次

项

系

数

中

有

的

内

积

计

算

，

就

可

以

用

kernelfunction

替

换

：

所

以

，

直

接

计

算

出

，

再

代

入

上

式

，

就

能

得

到

的

值

。

值

计

算

之

后

，

就

能

通过

得

到

拉

格朗

日

因

子

。

然

后

，下一

步

就

是

计

算

（

取

的

点

，

即

），

的

表

达

式

中

包

含

，

可

以作

如

下

推

导

：

这

样

得

到

的

就

可

以

用

kernelfunction

表

示

，

而

与

空

间

无

关

。

最

终

我

们

要

求

的矩

可

以作

如

下

推

导

：

至

此

，

dualSVM

中

我

们

所

有

需

要

求

解

的

参

数

都

已

经

得

到

了

，

而

且

整

个

计

算

过

程

中

都

没

有

在

空

间

作

内

积

，

即

与

无

关

。

我

们

把

这

个

过

程称

为

kerneltrick

，

也

就

是

把

特

征

转

换

和

计

算

内

积

两个

步

骤

结

合

起

来

，

用

kernelfunction

来

避

免

计

算

过

程

中

受

的

影

响

，

从

而

提

高

运

算

速

度

。

xTx′

′

Φ2(x)

(

)

Φ2(x′)

( )

′

O(d2)

( )

O(d)

(

)





(

, ) =

(

( )

′

)

′

KΦ(x,x′)=Φ(x)TΦ(x′)

(

, ) = 1 + ( ) + (

′

)

KΦ2(x,x′)=1+(xTx′)+(xTx′)2

qn,m

= =

( , )

qn,m=ynymznTzm=ynymK(xn,xm)

K(xn,xm)

( , )

qn,m

αn

−

( =

−

(

( , ))

∑

)

∑

b=ys−wTzs=ys−(∑n=1Nαnynzn)Tzs=ys−∑n=1Nαnyn(K(xn,xs))

gSVM

SVM

(

) =

sign

(

) +

) =

sign

((

) =

sign

( (

( ,

)) +

)

SVM

∑

)

∑

gSVM(x)=sign(wTΦ(x)+b)=sign((∑n=1Nαnynzn)Tz+b)=sign(∑n=1Nαnyn(K(xn,x))+b)





剩余163页未读，继续阅读

__盛夏光年__

粉丝: 482
资源: 9

台湾大学机器学习技法：寻找最优分类超平面

台湾大学-机器学习技法 全部课件

台湾大学林轩田机器学习笔记-机器学习技法，机器学习基石

机器学习学习笔记.pdf

机器学习 学习笔记 allinone

python机器学习导论笔记

国科大机器学习网安笔记

吴恩达机器学习笔记 pdf

数据分析与机器学习学习笔记

机器学习个人笔记完整版v5.24-a4

吴恩达机器学习笔记pdf

最新资源

台湾大学-机器学习技法全部课件

机器学习学习笔记 allinone