没有合适的资源?快使用搜索试试~ 我知道了~
首页深度学习基础巩固:大神精简笔记
深度学习基础巩固:大神精简笔记
需积分: 10 9 下载量 120 浏览量
更新于2024-07-16
收藏 3.78MB PDF 举报
"这是一份深度学习的精简笔记,由大神SteveZhu(朱鉴)编撰,旨在帮助读者巩固和强化深度学习的基础知识,适用于面试复习。笔记涵盖了一系列深度学习的基础概念,包括数学符号定义、线性代数、微积分以及概率和信息论的基础内容。" 笔记详细介绍了深度学习所需的数学基础知识,首先是符号定义,如标量、向量、矩阵和张量的表示,以及单位阵和标准基向量的概念。这些是构建神经网络和理解其运算的基础。此外,笔记还提到了向量和矩阵的特定操作,如对角方阵、转置、Moore-Penrose伪逆和逐元素乘积。 线性代数部分讲解了矩阵的转置、伪逆以及各种索引操作,这对于理解和实现线性变换及反演问题至关重要。矩阵的行列式、梯度和Hessian矩阵则涉及了微积分的知识,这些都是优化算法和理解损失函数曲面的关键。 微积分部分涵盖了基本的导数和偏导数,以及梯度和多元微积分中的Jacobian矩阵和Hessian矩阵,这些都是反向传播算法的基础。积分概念的引入则涉及到网络的训练过程,比如在计算期望值和方差时会用到。 概率和信息论部分讨论了独立事件、条件独立、概率分布以及期望和方差等概念,这些都是理解概率模型、贝叶斯推断以及深度学习中正则化和损失函数设计的基石。 此笔记适合已经有一定编程基础,想要深入了解深度学习原理和算法的读者。通过阅读这份笔记,读者可以强化对深度学习核心概念的理解,为深入学习和面试准备提供有力支持。
资源详情
资源推荐
2.2 向量 6
2.2.2 向量内积
给定两个向量 x, y ∈ R
n
,⟨x, y⟩ 被称为向量内积或点积
⟨x, y⟩ = x
⊤
y ∈ R
n
=
[
x
1
x
2
··· x
n
]
y
1
y
2
.
.
.
y
n
=
n
i=1
x
i
y
i
. (2.1)
通过上述定义可知向量内积满足如下引理
x
⊤
x ≥ 0, x
⊤
x = 0 ⇔ x = 0
x
⊤
y = y
⊤
x
(x + y)
⊤
z = x
⊤
z + y
⊤
z
(r x
⊤
)y = r(x
⊤
y) ∀r ∈ R
2.2.3 向量夹角及不等式
结合余弦定理,可推知如下定义
x
⊤
y = ||x||||y||cos θ (2.2)
其中 ||x|| 和 ||y|| 表示向量的长度,θ 表示向量的夹角。
公式2.2证明,根据余弦定理可知:
||x − y||
2
= ||x||
2
+ ||y||
2
− 2||x||||y||cos θ
同时根据点积的定义和向量长度定义可知:
||x − y||
2
= (x − y)
⊤
(x − y)
= x
⊤
x − x
⊤
y − y
⊤
x + y
⊤
y
= ||x||
2
− 2x
⊤
y + ||y||
2
因此有:
||x||
2
− 2x
⊤
y + ||y||
2
= ||x||
2
+ ||y||
2
− 2||x||||y||cos θ
x
⊤
y = ||x||||y||cos θ
由于 −1 ≤ cos θ ≤ 1,从上述余弦公式可知
x
⊤
y ≤ |x
⊤
y| ≤ ||x||||y||.
2.3 矩阵 7
对上述不等式两边取平方,可推知如下 Cauchy-Schwarz 不等式
|x
⊤
y|
2
≤ ||x||
2
||y||
2
. (2.3)
2.2.3.1 正交向量
正交向量表示向量 x 和 y 之间的夹角为 90
◦
,通过上述向量点击的余弦定义可知正交向
量之间的点积为 0
x
⊤
y = 0
2.2.4 向量外积
向量外积表示列向量乘以行向量,其运算结果为矩阵。假设 x ∈ R
n
, y ∈ R
m
,如下为两
个向量进行外积运算的结果:
x y
⊤
∈ R
n×m
=
x
1
x
2
.
.
.
x
n
[
y
1
y
2
··· y
m
]
=
x
1
y
1
x
1
y
2
··· x
1
y
m
x
2
y
1
x
2
y
2
··· x
2
y
m
.
.
.
.
.
.
.
.
.
.
.
.
x
n
y
1
x
n
y
2
··· x
n
y
m
2.3 矩阵
本节回顾矩阵的定义及矩阵的基本运算
2.3.1 矩阵定义
通常我们通过 A ∈ R
m×n
表示含 m 行和 n 列的矩阵,同时矩阵的每个元素为实数
2.3.2 矩阵内积
矩阵 A ∈ R
m×n
和 B ∈ R
m×
的内积结果为实数
⟨A, B⟩ = tr(A
⊤
B) =
i
j
A
i, j
B
i, j
(2.4)
上述公式中 tr(Z) 为矩阵的 trace,tr(Z) =
i
Z
i,i
2.3.3 矩阵乘法
矩阵 A ∈ R
m×n
和 B ∈ R
n×p
的结果依然是矩阵
C = AB ∈ R
m×p
,
2.3 矩阵 8
且
C
i, j
=
n
k=1
A
i,k
B
k j
. (2.5)
这里需要注意的是,仅当矩阵 A 的列数和矩阵 B 的行数一致时,矩阵间的相乘才是合法
的。
2.3.3.1 矩阵乘向量
给定矩阵 A ∈ R
m×n
和向量 x ∈ R
n
,矩阵和向量相乘的结果为向量 y = Ax ∈ R
m
。我
们将从不同角度回顾矩阵和向量的乘法运算。
假设我们将矩阵 A 表示为行向量形式,那么 Ax 运算表示为如下形式
y = Ax =
− a
⊤
1
−
− a
⊤
2
−
.
.
.
− a
⊤
m
−
x =
a
⊤
1
x
a
⊤
2
x
.
.
.
a
⊤
m
x
从上述计算方式可以看出,向量 y 的第 i 个元素为矩阵 A 的第 i 行和向量 x 的点积,
y
i
= a
⊤
i
x。
另外我们也可以将矩阵 A 表示为列向量形式,在该表示形式下,有
y = Ax =
| | |
a
1
a
2
··· a
n
| | |
x
1
x
2
.
.
.
x
n
=
a
1
x
1
+
a
2
x
2
+ ··· + +
a
n
x
n
.
从该形式来看,向量 y 为矩阵 A 的列向量的线性组合,线性组合的系数由向量 x 确定。
目前为止我们均是在矩阵的右边乘以列向量,但同时在矩阵的左边乘以行向量也是
合法的,该运算的结果仍为行向量。y
⊤
= x
⊤
A,其中 A ∈ R
m×n
,x ∈ R
m
,y ∈ R
n
。和
之前的矩阵列向量乘法运算类似,同样可以将运算表示为向量点积或行向量的线性组合。
向量点积的运算方式表示为如下所示形式:
y
⊤
= x
⊤
A = x
⊤
| | |
a
1
a
2
··· a
n
| | |
=
[
x
⊤
a
1
x
⊤
a
2
··· x
⊤
a
n
]
从该形式看向量 y
⊤
的第 i 个元素为向量 x 和矩阵 A 的第 i 列的点积。向量线性组合的
2.3 矩阵 9
运算方式表示为如下所示形式:
y
⊤
= x
⊤
A
=
[
x
1
x
2
··· x
n
]
− a
⊤
1
−
− a
⊤
2
−
.
.
.
− a
⊤
m
−
= x
1
[
− a
⊤
1
−
]
+ x
2
[
− a
⊤
2
−
]
+ ··· + x
n
[
− a
⊤
n
−
]
可以看到向量 y
⊤
是矩阵 A 的行向量的线性组合,线性组合的系数由向量 x 给定。
2.3.3.2 矩阵乘矩阵
有了矩阵向量相乘不同角度的运算基础,不同于本节开始给出的矩阵运算算法,现在我
们可以四个不同的角度来看矩阵和矩阵的相乘运算 C = AB。
首先我们可以将矩阵和矩阵的相乘运算看成一系列的向量点积运算。根据本节给出
矩阵相乘运算的定义,可以发现矩阵 C 的第 (i, j) 个元素等于矩阵 A 的第 i 行和矩阵 B
的第 j 列的点积。符号表示如下:
C = AB =
− a
⊤
1
−
− a
⊤
2
−
.
.
.
− a
⊤
m
−
| | |
b
1
b
2
··· b
p
| | |
=
a
⊤
1
b
1
a
⊤
1
b
2
··· a
⊤
1
b
p
a
⊤
2
b
1
a
⊤
2
b
2
··· a
⊤
2
b
p
.
.
.
.
.
.
.
.
.
.
.
.
a
⊤
m
b
1
a
⊤
m
b
2
··· a
⊤
m
b
p
由于 A ∈ R
m×n
,B ∈ R
n×p
,a
i
∈ R
n
,b
j
∈ R
n
,因此上述的点积均合法。上述将矩阵 A
看成行向量,矩阵 B 看成列向量为最自然的表示形式。另外我们也可以将矩阵 A 表示为
列向量,将矩阵 B 表示为行向量,采用该表示形式时,可以将 AB 看成所有向量向量外
积的和。符号表示如下:
C = AB =
| | |
a
1
a
2
··· a
n
| | |
− b
⊤
1
−
− b
⊤
2
−
.
.
.
− b
⊤
n
−
=
n
i=1
a
i
b
⊤
i
.
可以看出 a
i
∈ R
m
,b
⊤
i
∈ R
p
, 因此 a
i
b
⊤
i
∈ R
m×p
。该维度和矩阵 C 一致,上述公式中最后
的等式可能看上去不是那么直观,可以通过简单的形式来进行验证并一般化推广。
另外我们也可以将矩阵和矩阵的乘法运算看成一系列的矩阵和向量的乘法运算。假
设我们将矩阵 B 表示为列向量形式。可以将矩阵 C 的列表示为矩阵 A 和矩阵 B 的列向
2.4 矩阵操作和属性 10
量的乘积。符号表示如下:
C = AB = A
| | |
b
1
b
2
··· b
p
| | |
=
| | |
Ab
1
Ab
2
··· Ab
p
| | |
.
上述表示形式中 c
i
= Ab
i
,可以根据上节给出给出的两种不同视角进行矩阵列向量乘法
运算。
最后和矩阵向量运算类似,我们也可以将矩阵 A 表示为行向量,将矩阵 C 的行向量
看成矩阵 A 的行向量和矩阵 B 的乘法运算,符号表示如下:
C = AB =
− a
⊤
1
−
− a
⊤
2
−
.
.
.
− a
⊤
m
−
B =
− a
⊤
1
B −
− a
⊤
2
B −
.
.
.
− a
⊤
m
B −
.
上述表示形式中 c
⊤
i
= a
⊤
i
B。
最后矩阵乘法运算满足如下定律:
矩阵乘法满足结合律: (AB)C = A(BC)
矩阵乘法满足分配率: A(B + C) = AB + AC
矩阵乘法一般不满足交换律: AB , B A
2.4 矩阵操作和属性
本节回顾线性代数中矩阵的类型及矩阵的属性
2.4.1 单位阵和对角阵
单位阵 I
n
∈ R
n×n
,为方阵,对角线上的元素为 1,其他元素为 0。即:
I
i, j
=
1 i = j
0 i , j
(2.6)
对任意矩阵 A ∈ R
m×n
,存在如下等式
AI
n
= A = I
m
A
对角阵的所有非对角线元素为 0,对角阵一般表示为 D = diag(d
1
, d
2
, . . . , d
n
),存在
如下定义:
D
i, j
=
d
i
i = j
0 i , j
(2.7)
剩余151页未读,继续阅读
小新GSUNG0222
- 粉丝: 13
- 资源: 8
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- Vue实现iOS原生Picker组件:详细解析与实现思路
- Arduino蓝牙小车:参数调试与功能控制
- 百度Java面试精华:200页精选资源涵盖核心知识点
- Swift使用CoreData填坑指南:CoreData在Swift 3.0的变化
- 微距离无线充电器创新设计及其实验探索
- MTK Android平台开发全攻略:44步详解流程
- RecyclerView全面解析:替代ListView的新选择
- Android开发:自动适配中英文键盘解决方案
- Android调用WebService接口教程
- Android开发:BitmapUtil图片处理全解析与实例
- Android多线程断点续传实现详解
- PCA算法在人脸识别会议签到系统中的应用
- EventBus 3.0:Android事件总线详解与实战应用
- Android FileUtil:全面解析文件操作实用技巧与实例
- RecyclerView添加头部和尾部实战教程
- Android实现微博滑动固定顶部栏实战与优化
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功