迁移学习入门与实践指南

迁移学习

需积分: 10 159 浏览量更新于2024-07-18 收藏 3.21MB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

资源详情

资源推荐

迁移学习简明手册

迁移学习领域权威学者、香港科技大学杨强教授发表的迁移学习的综述文章 A survey

on transfer learning [Pan and Yang, 2010] 给出了负迁移的一个定义：

负迁移指的是，在源域上学习到的知识，对于目标域上的学习产生负面作用。

文章也引用了一些经典的解决负迁移问题的文献。但是普遍较老，这里就不说了。

所以，产生负迁移的原因主要有：

• 数据问题：源域和目标域压根不相似，谈何迁移？

• 方法问题：源域和目标域是相似的，但是，迁移学习方法不够好，没找到可迁移的成

分。

负迁移给迁移学习的研究和应用带来了负面影响。在实际应用中，找到合理的相似性，

并且选择或开发合理的迁移学习方法，能够避免负迁移现象。

最新的研究成果

随着研究的深入，已经有新的研究成果在逐渐克服负迁移的影响。杨强教授团队 2015 在

数据挖掘领域顶级会议 KDD 上发表了传递迁移学习文章 Transitive transfer learning [Tan et al., 2015]，

提出了传递迁移学习的思想。传统迁移学习就好比是踩着一块石头过河，传递迁移学习就

好比是踩着连续的两块石头。

更进一步，杨强教授团队在 2017 年人工智能领域顶级会议 AAAI 上发表了远领域迁

移学习的文章 Distant domain transfer learning [Tan et al., 2017]，可以用人脸来识别飞机！

这就好比是踩着一连串石头过河。这些研究的意义在于，传统迁移学习只有两个领域足够

相似才可以完成，而当两个领域不相似时，传递迁移学习却可以利用处于这两个领域之间的

若干领域，将知识传递式的完成迁移。这个是很有意义的工作，可以视为解决负迁移的有效

思想和方法。可以预见在未来会有更多的应用前景。

图 7对传递迁移学习给出了简明的示意。

图 7: 传递式迁移学习示意图

迁移学习简明手册

3. 基于模型的迁移学习方法 (Model based Transfer Learning)

4. 基于关系的迁移学习方法 (Relation based Transfer Learning)

这是一个很直观的分类方式，按照数据、特征、模型的机器学习逻辑进行区分，再加上

不属于这三者中的关系模式。

基于实例的迁移，简单来说就是通过权重重用，对源域和目标域的样例进行迁移。就是

说直接对不同的样本赋予不同权重，比如说相似的样本，我就给它高权重，这样我就完成了

迁移，非常简单非常非常直接。

基于特征的迁移，就是更进一步对特征进行变换。意思是说，假设源域和目标域的特征

原来不在一个空间，或者说它们在原来那个空间上不相似，那我们就想办法把它们变换到一

个空间里面，那这些特征不就相似了？这个思路也非常直接。这个方法是用得非常多的，一

直在研究，目前是感觉是研究最热的。

基于模型的迁移，就是说构建参数共享的模型。这个主要就是在神经网络里面用的特

别多，因为神经网络的结构可以直接进行迁移。比如说神经网络最经典的 netune 就是模

型参数迁移的很好的体现。

基于关系的迁移，这个方法用的比较少，这个主要就是说挖掘和利用关系进行类比迁

移。比如老师上课、学生听课就可以类比为公司开会的场景。这个就是一种关系的迁移。

目前最热的就是基于特征还有模型的迁移，然后基于实例的迁移方法和他们结合起来

使用。

迁移学习方法是本手册的重点。我们在后续的篇幅中介绍。

2.3 按特征分类

按照特征的属性进行分类，也是一种常用的分类方法。这在最近的迁移学习综述 [Weiss et al., 2016]

中给出。按照特征属性，迁移学习可以分为两个大类：

1. 同构迁移学习 (Homogeneous Transfer Learning)

2. 异构迁移学习 (Heterogeneous Transfer Learning)

这也是一种很直观的方式：如果特征语义和维度都相同，那么就是同构；反之，如果特

征完全不相同，那么就是异构。举个例子来说，不同图片的迁移，就可以认为是同构；而图

片到文本的迁移，则是异构的。

2.4 按离线与在线形式分

按照离线学习与在线学习的方式，迁移学习还可以被分为：

1. 离线迁移学习 (Oine Transfer Learning)

2. 在线迁移学习 (Online Transfer Learning)

目前，绝大多数的迁移学习方法，都采用了离线方式。即，源域和目标域均是给定的，

迁移一次即可。这种方式的缺点是显而易见的：算法无法对新加入的数据进行学习，模型也

无法得到更新。与之相对的，是在线的方式。即随着数据的动态加入，迁移学习算法也可以

不断地更新。

剩余85页未读，继续阅读

EricAn

粉丝: 2586
资源: 86

迁移学习入门与实践指南

迁移学习手册 1.0

迁移学习简明手册（王晋东）

迁移学习综述a survey on transfer learning的整理下载

领域自适应迁移学习python

对象存储s3学习手册

fusioncompute实验指导手册

delphi 10.1 firedac 数据库开发手册

ibm svc 维护手册

ibm v7000 用户手册

saphana中文手册

pl/sql developer使用手册

odoo开发手册第五版

sas9311-8i操作手册

pve虚拟化平台管理员手册7.pdf

vmware vsphere 6.7虚拟化完整祥细配置手册

data conversion hanbook

learning typescript pdf

bw4hana pdf

PaddleOCR文件夹讲解

vsan6.7 shouce

最新资源