迁移学习探析：从机器学习到深度学习的应用

需积分: 0 104 浏览量更新于2024-08-05 收藏 840KB PDF 举报

迁移学习(Transfer Learning)是机器学习领域的一个重要概念，它主要解决了当新任务的数据有限或者获取新任务数据的成本非常高时，如何有效地利用已有任务的知识来提升新任务的学习性能。迁移学习的核心思想是，通过在已经积累了大量数据和知识的源任务上学习到的模型，来改善目标任务的学习效果，即便源任务和目标任务之间存在差异。在实际应用中，通常存在以下四种情况： 1. 新数据集很小，并且与原始数据集相似：这种情况下，源任务的模型可以直接或经过微调后用于目标任务，因为两者具有高度的相关性。 2. 新数据集很小，但与原始数据集有很大的不同：尽管数据集不同，源任务的模型可能仍包含一些通用特征，可以通过调整来适应目标任务。 3. 新数据集很大，但与原始数据集有很小的不同：在这种场景下，源任务的模型可能作为一个好的起点，用于快速初始化目标任务的学习过程。 4. 新数据集很大，并且与原始数据集有很大不同：即使数据集规模大，由于差异显著，可能需要大量调整或重新训练模型，但源任务的某些知识仍然有助于减少学习的难度。迁移学习的类型主要包括： 1. 归纳迁移学习(Inductive Transfer Learning)：这是最常见的迁移学习形式，其中源任务的模型被调整以适应目标任务，然后用于对目标任务的未见过的样本进行预测。比如，预训练的深度学习模型如VGG、ResNet等，可以在新的图像分类任务上进行微调，从而提高分类效果。 2. 转导迁移学习(Transductive Transfer Learning)：这种类型的迁移学习不直接预测目标任务的未知样本，而是通过学习源任务和目标任务的共同样本来改进目标任务的性能。它适用于源任务和目标任务共享部分样本的情况。 3. 无监督迁移学习(Unsupervised Transfer Learning)：在没有目标任务标签的情况下，从源任务中学习特征表示，然后将这些表示应用于目标任务的无监督学习或弱监督学习。这对于目标任务数据缺乏标签的情况特别有用。归纳迁移学习是当前深度学习中最常见的迁移学习方法，例如在自然语言处理中，预训练的BERT模型就是归纳迁移学习的实例，它在大规模的无标注文本上学习通用的语言表示，然后可以应用于各种下游任务，如问答、情感分析等，通过微调以适应特定任务的需求。在实践中，迁移学习的关键步骤包括选择合适的预训练模型、确定模型的适应策略（如微调层的数量、学习率等）、以及验证迁移学习的效果。同时，迁移学习也面临一些挑战，如过拟合、负迁移等问题，需要通过正则化、模型选择等技术来克服。迁移学习是机器学习领域的一个强大工具，它极大地推动了深度学习在各种实际问题上的应用和性能提升。

机

器

学

习

与

深

度

学

习

⾯

试

系

列

⼆

⼗

（

迁

移

学

习

）

迁

移

学

习

(

)

的

动

机是

什么

？

⼈

类

⼤

脑

具

有

跨

任

务

传

递

知

识

的

内

在

能

⼒

。

我

们

在

学

习

⼀

项

任

务

时

获

得

的知

识

，

可

能

会

对

我

们

解

决

相

关

的

任

务

有

所

帮

助

。

任

务

越

相

关

，

我

们

就

越

容

易

转

移

或

交

叉

利

⽤

我

们

的知

识

。

例

如

：

•

知

道

如

何

骑

⾃

⾏

⻋

，

学

习

如

何

骑

摩

托

⻋

•

知

道

如

何

弹

奏

古

典

钢

琴

，

学

习

如

何

弹

奏

爵

⼠

钢

琴

•

了

解

数

学

和

统

计

学

，

学

习

机

器

学

习

在

这

些例

⼦

中⼈

类

不

会从

头

开

始

学

习

所

有

内

容

，

⽽

是

会

利

⽤

之

前

学

习

的

领

域

的知

识

并

将

其

转

移

到

新

的

领

域

和

任

务

中

，

这

就

是

迁

移

学

习

的

灵

感

来

源

。

标

准

机

器

学

习

的

前

提

假

设

是

训

练

数据

和

测

试

数据

的

分

布

是

相

同

的

。

如

果

不

满

⾜

这

个

假

设

，

在

训

练

集

上

学

习

到

的

模

型在

测

试

集

上

的

表

现

会

⽐

较

差

，

⽽

在

很

多

实

际

场

景

中

，

经

常

碰

到

的

问题

是标

注

数据

的

成

本

⼗

分

⾼

，

⽆

法

为

⼀个

⽬

标

任

务准

备

⾜

够多

相

同

分

布

的

训

练

数据

。

因

此

，

如

果有

⼀个

相

关

任

务

已

经

有

了

⼤

量

的

训

练

数据

，

虽

然

这

些

训

练

数据

的

分

布

和

⽬

标

任

务

不

同

，

但

是

由

于

训

练

数据

的

规

模⽐

较

⼤

，

我

们

假

设

可

以从中

学

习

某

些

可

以

泛

化

的知

识

，

那

么

这

些

知

识

对

⽬

标

任

务

会

有

⼀

定

的

帮

助

。

将

相

关

任

务

的

训

练

数据

中

的

可

泛

化

知

识

迁

移

到

⽬

标

任

务

上，

就

是

迁

移

学

习

。

迁

移

学

习

有

哪

⼏

种

类

型

？

假

设

⼀个

机

器

学

习任

务

的

样本

空

间

为

，

其

中

为

输

⼊

空

间

，

为

输

出

空

间

，

其

概

率

密

度

函

数

为

。

为

简

单

起

⻅

，

这

⾥

设

为

维

实

数

空

间

的

⼀个

⼦

集

，

为

⼀个

离

散

的

集

合

。

⼀个

样本

空

间

及

其分

布

可

以

称

为

⼀个

领

域

(

)

：

。

给

定

两个

领

域

，

如

果

它

们

的

输

⼊

空

间

、

输

出

空

间

或

概

率

分

布

中

⾄

少

⼀个不

同

，

那

么

这

两个

领

域

就

被认

为

是

不

同

的

。

从

统

计

学

习

的

观

点

来

看

，⼀个

机

器

学

习任

务

定

义为

在

⼀个

领

域

上

的

条

件

概

率

的

建

模

问题

。

迁

移

学

习

就

是

两个不

同

领

域

的知

识

迁

移

过

程

，

利

⽤

源

领

域

(

our

)

中

学

到

的知

识

来

帮

助

⽬

标

领

域

(

)

上

的

学

习任

务

。

源

领

域

的

训

练

样本

数

量

⼀

般

远

⼤

于

⽬

标

领

域

。

迁

移

学

习

根

据

不

同

的

迁

移

⽅

式

⼜

分

为

三个

类

型

：

•

归

纳

迁

移

学

习

(

)

•

转

导

迁

移

学

习

(

)

•

⽆

监督

迁

移

学

习

(

nsup

)

下载后可阅读完整内容，剩余3页未读，立即下载

AshleyK

粉丝: 26
资源: 315

迁移学习探析：从机器学习到深度学习的应用

机器学习与深度学习面试系列十七（Embedding初步）1

深度学习500问的pdf版本

深度学习常见面试题.pdf

天池大神机器学习岗面试资料

Deep Learning Interview 深度学习面试题目汇总

深度学习面试题英文版-推荐

CV总复习--深度学习机器学习基础篇（三）.zip

计算机专业研究生复试-机器学习面试简答题.docx

2020年的算法实习岗位信息表，部分包括内推码，和常见深度学习算法岗面试题及答案-python

最新资源