机器学习深度学习：张量、矩阵与范数解析

需积分: 40 159 浏览量更新于2024-07-18 收藏 21.07MB PDF 举报

"这是关于机器学习和深度学习基础知识的概述，主要涵盖了数学概念，如标量、向量和张量，以及它们之间的联系。此外，还介绍了矩阵与向量的乘法以及不同范数的计算方法。" 在机器学习和深度学习领域，扎实的数学基础至关重要。本资料首先阐述了标量、向量和张量的基本概念。标量是无方向的数值，如长度，只代表单一的量。向量则包含大小和方向，例如物理中的力，不仅有大小，还有朝向。而张量是更一般的概念，它可以是任意维度的数组，用来描述多维空间中的数据，如图像像素或多元统计数据。张量与矩阵的关系在于，矩阵是二维张量的特例，可以视为一维向量的扩展。从代数角度看，矩阵是按行列排列的元素集合，而张量则扩展到了更多维度。几何上，矩阵和向量是不变量，不随坐标变换而改变。值得注意的是，尽管张量可以表示为矩阵，但其内涵更为广泛。矩阵和向量的乘法运算遵循特定规则。当一个m行n列的矩阵与一个n维向量相乘时，结果是一个m维向量。这种乘法涉及每行矩阵元素与向量元素的逐个乘积之和。向量和矩阵的范数是衡量其大小或强度的概念。对于向量，1范数是所有元素绝对值的和，2范数是元素平方和的平方根，相当于欧几里得距离，负无穷范数是最小绝对值，正无穷范数是最大绝对值。对于矩阵，1范数是所有列向量绝对值和的最大值，2范数是其转置与自身相乘后最大特征值的平方根，无穷范数是所有行向量绝对值和的最大值。这些基础知识是理解机器学习和深度学习模型，如神经网络中权重矩阵、梯度计算、优化过程以及损失函数等核心概念的基础。掌握这些内容有助于深入探究复杂的机器学习算法和系统，从而进行有效的模型训练和预测。

4）举例，告诉一张包含气球的图片，需要得出气球在图片中的位置及气球和背景的分割

线，这就是已知弱标签学习强标签的问题。

在企业数据应用的场景下，人们最常用的可能就是监督式学习和非监督式学习的模型。

在图像识别等领域，由于存在大量的非标识的数据和少量的可标识数据，目前半监督式学习

是一个很热的话题。

2.3

监督学习有哪些步骤

监督式学习：

监督学习是使用已知正确答案的示例来训练网络。每组训练数据有一个明确的标识或结果，

想象一下，我们可以训练一个网络，让其从照片库中（其中包含气球的照片）识别出气球的照

片。以下就是我们在这个假设场景中所要采取的步骤。

步骤 1：数据集的创建和分类

首先，浏览你的照片（数据集），确定所有包含气球的照片，并对其进行标注。然后，将

所有照片分为训练集和验证集。目标就是在深度网络中找一函数，这个函数输入是任意一张照

片，当照片中包含气球时，输出 1，否则输出 0。

步骤 2：训练

选择合适的模型，模型可通过以下激活函数对每张照片进行预测。既然我们已经知道哪些

是包含气球的图片，那么我们就可以告诉模型它的预测是对还是错。然后我们会将这些信息反

馈（feed back）给网络。

该算法使用的这种反馈，就是一个量化“真实答案与模型预测有多少偏差”的函数的结果。

这个函数被称为成本函数（cost function），也称为目标函数（objective function），效用函数（utility

function）或适应度函数（fitness function）。然后，该函数的结果用于修改一个称为反向传播

（

backpropagation

）过程中节点之间的连接强度和偏差。

我们会为每个图片都重复一遍此操作，而在每种情况下，算法都在尽量最小化成本函数。

其实，我们有多种数学技术可以用来验证这个模型是正确还是错误的，但我们常用的是一

个非常常见的方法，我们称之为梯度下降（

gradient descent

）。

步骤 3：验证

当处理完训练集所有照片，接着要去测试该模型。利用验证集来来验证训练有素的模型是

否可以准确地挑选出含有气球在内的照片。

在此过程中，通常会通过调整和模型相关的各种事物（超参数）来重复步骤 2 和 3，诸如

里面有多少个节点，有多少层，哪些数学函数用于决定节点是否亮起，如何在反向传播阶段积

极有效地训练权值等等。

步骤 4：测试及应用

当有了一个准确的模型，就可以将该模型部署到你的应用程序中。你可以将模型定义为

API

调用，并且你可以从软件中调用该方法，从而进行推理并给出相应的结果。

2.4

多实例学习？

多示例学习

(multiple instance learning)

：已知包含多个数据的数据包和数据包的标签，训

练智能算法，将数据包映射到标签的过程，在有的问题中也同时给出包内每个数据的标签。

比如说一段视频由很多张图组成，假如 10000 张，那么我们要判断视频里是否包含某一物

体，比如气球。单张标注每一帧是否有气球太耗时，通常人们看一遍说这个视频里是否有气球，

就得到了多示例学习的数据。10000 帧的数据不是每一个都有气球出现，只要有一帧有气球，

那么我们就认为这个数据包是有气球的。只有当所有的视频帧都没有气球，才是没有气球的。

从这里面学习哪一段视频（

10000

张）是否有气球出现就是多实例学习的问题。

2.5

分类网络和回归的区别？

2.3

小节介绍了包含气球照片的数据集整理。当照片中包含气球时，输出

，否则输出

。

此步骤通常称为分类任务（categorization task）。在这种情况下，我们进行的通常是一个结果为

yes or no 的训练。

但事实上，监督学习也可以用于输出一组值，而不仅仅是

或

。例如，我们可以训练一

个网络，用它来输出一张图片上有气球的概率，那么在这种情况下，输出值就是 0 到 1 之间的

任意值。这些任务我们称之为回归。

2.6 什么是神经网络？

神经网络就是按照一定规则将多个神经元连接起来的网络。不同的神经网络，具有不同的

连接规则。

例如全连接(full connected, FC)神经网络，它的规则包括：

1）有三种层：输入层，输出层，隐藏层。

）同一层的神经元之间没有连接。

3）full connected 的含义：第 N 层的每个神经元和第 N-1 层的所有神经元相连，第 N-1

层神经元的输出就是第 N 层神经元的输入。

剩余366页未读，继续阅读

lllzzr18

粉丝: 1

机器学习深度学习：张量、矩阵与范数解析

TD-LTE百问丛书_之_入门集.pdf

机器学习500问()

最新30个最炙手可热的GitHub 机器学习开源项目简介及链接

KrishnaNJena：探索GitHub上的机器学习和深度学习项目

Github存储库整理机器学习与深度学习精选文章

机器学习深度学习基础算法知识笔记与案例代码.zip

ai-tiwari.github.io:深度学习教程

【机器学习、深度学习入门、进阶、深入指南】每一阶段必读论文arxiv.org免费下载链接+课程链接+github代码链接

ML-NLP：此项目是机器学习（机器学习），深度学习（深度学习），NLP面试中常考到的知识点和代码实现，也是一个算法工程师必会的理论基础知识

最新资源