深度信念网络原理与Theano实现_MNIST识别

版权申诉

128 浏览量更新于2024-06-26 收藏 2.2MB PDF 举报

"该资源是一份关于深度学习算法和神经网络架构的教程，特别关注深度信念网络(DBN)。课程详细讲解了如何通过堆叠预训练的受限玻尔兹曼机(RBM)并进行微调，形成深度信念网络，并使用Theano库进行实现。同时，教程中还包含在MNIST手写数字识别任务中的应用实例。" 深度信念网络（Deep Belief Network，DBN）是2006年由Geoffrey Hinton提出的一种无监督学习的深度网络模型，它由多个受限玻尔兹曼机（Restricted Boltzmann Machine，RBM）层堆叠而成。RBM是一种二元玻尔兹曼机，能够学习数据的潜在分布式表示。在DBN中，每一层RBM的隐藏层成为上一层RBM的可见层，形成一个逐层连接的结构。 DBN的工作原理包括两个主要阶段：预训练和微调。在预训练阶段，每个RBM逐个被训练，下一层RBM的可见层由上一层RBM的隐藏层状态提供。首先，输入数据加载到最底层RBM的可见层，然后通过 Contrastive Divergence 或其他方法进行训练。训练完成后，隐藏层的状态被视为输入数据的特征表示。这个过程逐层向上，直到所有RBM都完成训练。在微调阶段，预训练的DBN作为一个初始化的深层神经网络，通过反向传播算法和有监督学习进行进一步的训练。通常，最顶层的RBM的隐藏层会连接到一个全连接的输出层，用于分类或回归任务。在MNIST手写数字识别任务中，DBN可以用来学习手写数字的特征表示，然后用这些特征进行数字分类。 Theano是一个开源的Python库，支持定义、优化和评估数学表达式，特别是用于深度学习的张量计算。在本教程中，作者将演示如何使用Theano构建和训练深度信念网络，以及如何将其应用于实际的手写数字识别问题。深度信念网络尽管在现代深度学习实践中已不如从前那么常见，但它仍然是理解深度学习原理和无监督预训练的重要工具。尤其是在处理高维数据和特征提取时，DBN的方法仍然有价值。此外，DBN的预训练技术也被应用于其他深度学习模型，如卷积神经网络（CNN），以提高模型的性能和收敛速度。

第 11 章深度信念网络

-387-

对神经网络的调试。

第 4 行：定义网络的名称，因为在深度信念网络中，我们会将预训练好的受限玻尔兹

曼机堆叠起来，为了区分不同的受限玻尔兹曼机，需要给其起不同的名字。

第 6 行：定义学习率。

第 7 行：定义完整学习整个训练样本集的遍数。

第 8 行：迷你批次中的样本数量。

第 9 行：调整项类型，在这里使用 L2 调整项，即权值衰减项。

第 10 行：定义 L2 调整项（权值衰减）的系数。

第 12 行：定义隐藏层神经元数量。

第 13 行：定义可见层神经元类型，经典受限玻尔兹曼机的可见层是二进制类型的，如

本例所示。而现在经过扩展的受限玻尔兹曼机可以支持连续型变量。

第 14 行：吉布斯采样次数。

第 15 行：定义正态分布中的标准差。

第 16 行：定义可见层和隐藏层之间的连接权值。

第 17 行：定义隐藏层的偏置值矩阵。

第 18 行：定义可见层的偏置值矩阵。

第 19 行：权值更新时 TensorFlow 计算图中的节点。

第 20 行：隐藏层偏置值更新时对应的 TensorFlow 计算图中的节点。

第 21 行：可见层偏置值更新时对应的 TensorFlow 计算图中的节点。

第 22 行：代价函数在 TensorFlow 计算图中的节点。

第 23 行：输入信号变量。

第 24 行：隐藏层对应的 placeholder。

第 25 行：可见层对应的 placeholder。

第

26 行：本模型对应的 TensorFlow 计算图。

第 27 行：输入向量维度。

下面来看受限玻尔兹曼机的模型创建过程，代码如下：

1 def build_model(self):

2 print('Build RBM Model')

3 self.X = tf.placeholder(shape=[None, self.n], dtype=tf.float32, name='X')

4 self.hrand = tf.placeholder(shape=[None, self.num_hidden],

5 dtype=tf.float32, name='h')

6 self.vrand = tf.placeholder(shape=[None, self.n],

7 dtype=tf.float32, name='v')

8 self.y = tf.placeholder(shape=[None, 10], dtype=tf.float32, name='y')

9 self.keep_prob = tf.placeholder(dtype=tf.float32, name='keep_prob')

10 #

11 self.W = tf.Variable(tf.truncated_normal(shape=[self.n, self.num_hidden],

12 mean=0.0, stddev=0.1), name='W')

13 self.bh_ = tf.Variable(tf.constant(0.1, shape=[self.num_hidden]),

14 name='bh')

15 self.bv_ = tf.Variable(tf.constant(0.1, shape=[self.n], name='bv'))

16 #

17 self.encode, _ = self.sample_hidden_from_visible(self.X)

深度学习算法实践（基于 Theano 和 TensorFlow）

-388-

18 self.reconstruction = self.sample_visible_from_hidden(

19 self.encode, self.n)

20 hprob0, hstate0, vprob, hprob1, hstate1 = self.gibbs_sampling_step(

21 self.X, self.n)

22 self.vprob = vprob

23 self.hprob = hprob1

24 positive = self.compute_positive_association(self.X,

25 hprob0, hstate0)

26 nn_input = vprob

27 for step in range(self.gibbs_sampling_steps - 1):

28 hprob, hstate, vprob, hprob1, hstate1 = self.gibbs_sampling_step(

29 nn_input, self.n)

30 nn_input = vprob

31 negative = tf.matmul(tf.transpose(vprob), hprob1)

32 #

33 self.w_upd8 = self.W.assign_add(

34 self.learning_rate * (positive - negative) / self.batch_size)

35 self.bh_upd8 = self.bh_.assign_add(tf.multiply(self.learning_rate,

36 tf.reduce_mean(tf.subtract(hprob0, hprob1), 0)))

37 self.bv_upd8 = self.bv_.assign_add(tf.multiply(self.learning_rate,

38 tf.reduce_mean(tf.subtract(self.X, vprob), 0)))

39 clip_inf = tf.clip_by_value(vprob, 1e-10, float('inf'))

40 clip_sup = tf.clip_by_value(1 - vprob, 1e-10, float('inf'))

41 loss = - tf.reduce_mean(tf.add(

42 tf.multiply(self.X, tf.log(clip_inf)),

43 tf.multiply(tf.subtract(1.0, self.X),

44 tf.log(clip_sup))))

45 self.cost = loss + self.regcoef*(tf.nn.l2_loss(self.W) +

46 tf.nn.l2_loss(self.bh_) + tf.nn.l2_loss(self.bv_))

第 3 行：定义用于存放输入信号的 placeholder，其为包含一个迷你批次的设计矩阵，第

一维是迷你样本集中的序号，第二维为样本特征值向量。

第 4、5 行：定义初始化隐藏层为随机数时用的 placeholder，第一维为迷你批次中的样

本序号，第二维为隐藏层神经元数。

第 6、7 行：定义初始化可见层为随机数时用的 placeholder，第一维为迷你批次中的样

本序号，第二维为可见层神经元数。

第 8 行：定义正确分类结果标签集的 placeholder，由于受限玻尔兹曼机为非监督学习，

所以这个变量目前没有用到。

第 11、12 行：定义可见层与隐藏层之间的连接权值矩阵 W，用均值为 0.0、标准差为

0.1 的正态分布随机数进行初始化。

第 13、14 行：定义隐藏层神经元偏置值 bh_，用常数 0.1 进行初始化。

第 15 行：定义可见层神经元偏置值 bv_，用常数 0.1 进行初始化。

第 17 行：定义受限玻尔兹曼机编码过程，调用本类 sample_hidden_from_visible 方法，

通过可见层状态求出隐藏层状态，可以视为对原始信号进行编码，或者提取出其中的特征。

第 18、19 行：定义重建算子，调用本类 sample_visible_from_hidden 方法，由隐藏层状

态求出可见层状态，相当于通过特征恢复原始信号。

第 20、21 行：定义吉布斯采样算子，调用本类 gibbs_sampling_step 方法，即先由可见

层求出隐藏层状态 0，再由隐藏层状态求出可见层状态，最后由新的可见层状态求出隐藏层

剩余36页未读，继续阅读

好知识传播者

粉丝: 1666
资源: 4133

深度信念网络原理与Theano实现_MNIST识别

DBN实例1深度信念网络,dbn深度置信网络,matlab源码.zip

深度信念网络实例

net_struc_str = '{} - {}'.format(self.netD.__class__.__name__, self.netD.module.__class__.__name__) 解释该段代码

深度学习——卷积神经网络算法原理与应用 pdf

solidworks电气设计实例详解.pdf

深度学习算法习题手册

深度学习基础教程 pdf

visual basic.net图形图像编程与实例详解pdf

matlab神经网络43个案例分析.pdf

simulink实例详解pdf

最新资源

net_struc_str = '{} - {}'.format(self.netD.class.name, self.netD.module.class.name) 解释该段代码