优化胶囊网络：设计与效率提升

186 浏览量更新于2024-06-20 收藏 1.15MB PDF 举报

"本文探讨了神经网络胶囊的设计与运行效率优化，重点关注了胶囊网络在处理模式变体时的优势以及如何通过优化路由方案提升模型的效率。文章由李红阳、郭晓阳、戴波、欧阳万里和王晓刚共同完成，分别来自香港中文大学和悉尼大学SenseTime计算机视觉研究小组。主要讨论的关键词包括网络架构设计、胶囊特征学习、路由方案等。" 神经网络胶囊是深度学习领域的一种创新架构，旨在解决传统卷积神经网络（CNN）在处理物体的多视角、旋转和变形等变化时的局限性。与CNN中单个神经元检测特定特征不同，胶囊网络中的胶囊由一组神经元构成，输出向量形式的信息，能够表示模式的多种变体，如姿态、形状和纹理等。这种向量输出能捕捉到特征的多个方面，提高了模型对物体识别的鲁棒性。传统的CNN需要通过堆叠多层来处理模式的多种变体，这增加了计算复杂度和内存需求。胶囊网络通过一种称为路由的机制解决了这个问题，使得较低层的胶囊只激活与其高层对应物相似的模式。然而，这种路由过程在大规模网络中可能会变得非常耗时。针对这一问题，作者提出了一种新的两分支路由方案，包括主分支和辅助分支。主分支负责收集下层直接相邻胶囊的主要信息，而辅助分支则利用其他下层胶囊编码的模式变体来补充信息。这种快速、有监督的一次性路由策略显著降低了模型复杂性和运行时间。为了解决信息在层间传递过程中可能的损失，作者设计了反馈协议单元，它将高层胶囊的反馈信息传递给下层，起到了网络正则化的效果。反馈协议基于最佳运输发散来比较低层和高层胶囊的分布，帮助维持信息的一致性。这种反馈机制进一步增强了胶囊网络的表现。实验结果显示，提出的En-capNet模型在CIFAR10/100、SVHN和ImageNet的子集上优于先前的技术，验证了胶囊网络和优化的路由方案在特征学习和网络效率上的优势。这项工作为构建更高效、更具适应性的深度学习模型提供了新的思路和方法。

H. Li

等人

E-步骤

respectively

对于

动态

路由

，

给定

（

）

←

，

←

0，

我们具有：

（

）

←

（

）

（

）

，

⑴

ij ij

J| I

其中，输入的最

大值是通过squash（

）来

计算的，

即

，v=

.路由系数的更新在

1+ s

坐标下降方式，其交替优化

和

。对于

路由，

给定

（

）

←

，

←

0，以及输入捕获器

的活动记录，我们

可以

将

输

入捕获

器

在第

2代自动捕获

器中进行聚合：

（

）

，

（

）

，

（

）

←

（

）

，

、

（二）

j j j

M-步骤

，

J|我

（

+1）

←

（

）

，

（

）

，

（

）

，

（

3）

国际新闻报

我

J| i

j j

其中，聚类

的平均值被视为输出胶囊

。M步生成

是指在一个

连接

上

执行动作，以确定该设备和数据

。

更

高的覆盖率;在

步骤中，每个步

骤都是可变的，以提高最终的成本效益

。

从而在迭代R次之后获得来自

胶囊层

的

输出

2.2

CapNet协议路由分析

协议路由的有效性。图2示出了随着网络的发展，相邻胶囊之间的

路由本质上，路由过程是从所有较低封装体到较高实体的加权平

均（等式11）。（四））。直观地，给定属于第j类的样本，网络

试图优化胶囊学习，使得最终胶囊层中的长度（存在概率）应该

是最大的这要求类似于胶囊j的其较低对应物的量值应当占据大多

数并且与不类似于j的其他对应物相比具有更高的长度。以Dynamic

case

的

第一行为例。在第一个时期，内核权重

，

用高斯初始化，

因此大多数胶囊彼此正交并且具有相同的长度。随着训练的进行

（时期20和80），余弦相似性在零附近的“模糊”胶囊的百分比

和

长度

下降，并且分布演变成极化：最相似和最不相似的胶囊逐渐占据大多

数并且保持比其他胶囊更高的长度

。

随着时间的推移

，胶囊

化

过程

（

例如

200）

进一步极化，并且网络处于稳定状态，其中最相似和

不相似的胶囊具有比其他胶囊更高的百分比和长度协议路由

的

作

用是调整从较低胶囊到较高胶囊的幅度和相关性，使得可以适当

地开启相关较高对应物

的

激活，并且传递来自较低胶囊的模式信

息

对

电磁

路由的分析得出了一致的结论。极化现象被进一步加强（

参

见图

）。

（h）与（d）在图中。（2）译注。不相似胶囊的百分比较

低（20% vs 37%），而相似胶囊的长度较高（0.02 vs 0.01）：这意味

着

可能是比动态更好的路由解决方案，这也通过表1中的（a）对

（b）来验证。

剩余15页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

优化胶囊网络：设计与效率提升

优化神经网络

神经网络和胶囊网络区别

胶囊神经网络输入维度

基于卷积运算的神经网络系统称为 a卷积神经网络b自编码神经网络 c胶囊网络d生成对抗网络

四元数神经网络 综述

卷积神经网络是传统神经网络还是新型神经网络

传统神经网络和新型神经网络的区别

tensorflow训练胶囊神经网络

胶囊网络 损失函数优化器选择有哪些

卷积神经网络的改进与拓展

最新资源

四元数神经网络综述

胶囊网络损失函数优化器选择有哪些