受限玻尔兹曼机详解：Sigmoid、Bayes与蒙特卡洛方法的应用

1星需积分: 32 107 浏览量更新于2024-09-13 4 收藏 906KB PDF 举报

受限玻尔兹曼机（Restricted Boltzmann Machine, RBM）是一种深度学习中的基础模型，它属于无监督学习算法，用于处理高维数据并学习其潜在结构。本文将详细介绍RBM的基础知识，包括Sigmoid函数的运用、Bayes定理在概率建模中的作用，以及与蒙特卡洛方法和马尔科夫链的关系。 1. **Sigmoid函数** Sigmoid函数是神经网络中常见的非线性激活函数，其公式为：σ(x) = 1 / (1 + e^(-x))（公式1）。Sigmoid函数将输入映射到(0, 1)之间，常用于二元分类问题中的输出层，因为它可以将输出解释为置信度。其图像呈现出S形，具有平滑连续的特性。 2. **Bayes定理的应用** Bayes定理是概率论的核心原理，在深度学习中用于条件概率的计算。公式2阐述了P(A|B)（后验概率）与P(B|A)（似然概率）、P(A)（先验概率）和P(B)（边缘概率）之间的关系。在RBM中，它用于计算给定观察数据下模型参数的更新，体现了概率模型的推断过程。 3. **蒙特卡洛方法** 当积分问题难以解析求解时，蒙特卡洛方法提供了一种基于随机采样的策略。在RBM中，这种方法用于估计复杂函数的期望值，通过将函数分解成容易处理的部分（如概率密度函数p(x)）乘以f(x)，并通过大量样本的平均值来近似原积分（公式4和5）。 4. **马尔科夫链** 马尔科夫链在RBM的训练过程中也有所体现，特别是在 Contrastive Divergence (CD) 算法中。CD是一种近似梯度下降的方法，它利用马尔科夫链的状态转移概率构建模拟退火过程，以便在无显式反向传播的情况下更新模型参数。Xt代表随机变量在不同时间步的状态，其转移概率仅依赖当前状态（公式最后部分）。受限玻尔兹曼机的学习涉及了概率统计、非线性函数选择（Sigmoid）、概率推理（Bayes定理）以及随机方法（蒙特卡洛），这些都是理解和实现RBM的关键要素。通过这些概念，RBM能够在高维数据中捕捉潜在的低维结构，并被广泛应用于诸如推荐系统、特征提取和生成模型等领域。

















n,n,n,n

n,,,

P...PP

......

P...PP

),...,(),...,(

22212

12111



公式（9）

其中矩阵 P 为转移概率矩阵。

如果存在某一个值，从它出发转移回自身所需要的转移次数总是整数 d(>1)的倍数，则

该马尔科夫过程具有周期性。若果任意两个取值之间总是以非零的概率相互转移，则该马尔

科夫过程称为不可约，即每个状态都可以来自任意的其他状态。如果一个马尔科夫过程既没

有周期性，又不可约，则称该马尔科夫过程是各态遍历的。

对于各态遍历的马尔科夫过程，无论 π

(0)

取何值，随着转移次数的增多，随机变量的取

值分布最终都会收敛于唯一的平稳分布 π

，即

*P*

*Plim

t)(







公式（10）

如果在某个分布下采样，只需要模拟以为平稳分布的马尔科夫过程，经过足够多次转移

之后，样本分布就会充分接近该平稳分布。

正则分布

假设一个物理系统具有一定的自由度，则系统所处的状态就具备一定的随机性。假设系

统处于状态 i 的概率为 p

，则有





1且0

p,p

公式（11）

根据系统的物理性质，不同的状态可能会使系统具备不同的能量。用 E

表示系统处于

状态 i 时的能量，当系统与外界达到热平衡时，系统处于状态 i 的概率 p

有以下形式







eZ,e

公式（12）

称为归一化常数，T 为正数，表示系统所处于的温度。在同一温度下，能量越小的状

态具有越大的概率；当温度 T 升高时，概率分布会对能量越来越不敏感，并逐渐趋近于均匀

分布。当 T 趋向无穷大是，整体分布完全退化为均匀分布，此时系统的状态变得完全随机。

Metropolis-Hastings 采样

Metropolis-Hastings 是一种非常重要的 MCMC 采样算法，引入转移提议分布（Proposal

density）Q(.;i)，假设从分布 π(.)上采集样本，根据当前状态 i，利用 Q(.;i)提议下一步状态，

则接受概率为

}

)i;j(Q)i(

)j;i(Q)j(

,min{





1）（  ji

公式（13）

为了模拟接受新状态 j 的过程，首先产生一个[0，1]之间的均匀分布的随机数 r，然后如

果

）（ ji 



，则采用状态 j 作为新状态，否则维持状态 i 不变。Q(j;i)表示从状态 i 提

议转移到状态 j 的概率。

对于任意状态 i，j，成立如下的细致平衡条件（detailed balance）

剩余12页未读，继续阅读

wuqingshan2010

粉丝: 43

受限玻尔兹曼机详解：Sigmoid、Bayes与蒙特卡洛方法的应用

pytorch构建多模型实例

pytorch:实现简单的GAN示例(MNIST数据集)

pytorch-rbm:PyTorch中的受限玻尔兹曼机（RBM）

受限玻尔兹曼机RBM

受限玻尔兹曼机RBM简述与Python实现

受限玻尔兹曼机RBM详解：网络结构与概率分布

受限玻尔兹曼机(RBM)学习笔记

受限玻尔兹曼机（RBM） MATLAB

RBM受限玻尔兹曼机

RBM 受限玻尔兹曼机

最新资源