胶囊网络中的动态路由机制:实现MNIST数据集上的顶尖性能

1星 需积分: 9 8 下载量 116 浏览量 更新于2024-09-09 收藏 1.82MB PDF 举报
Dynamic Routing Between Capsules Capsule 网络是一种基于神经网络的结构,它由多个 capsule 组成,每个 capsule 都是一组神经元的集合。这些神经元的活动向量(activity vector)表示特定实体类型的实例化参数,如对象或对象部分。 Capsule 网络的关键思想是使用活动向量的长度来表示实体存在的概率,向量方向表示实例化参数。 _capsule_之间的动态路由(Dynamic Routing)机制是指较低级别的 _capsule_ 通过变换矩阵对更高级别的 _capsule_ 的实例化参数进行预测。当多个预测一致时,更高级别的 _capsule_ 变得活跃。这种机制使得 Capsule 网络能够学习到更 abstract 的实体表示,从而提高了网络的表达能力和泛化能力。 在 MNIST 数据集上的实验结果表明,使用 Dynamic Routing 机制的多层 Capsule 系统达到了顶尖的性能,远远优越于卷积网络在识别高度重叠数字时的性能。这种结果证明了 Capsule 网络的强大表达能力和泛化能力。 Dynamic Routing 机制的关键是 routing-by-agreement 机制,即较低级别的 _capsule_ 偏向于将输出发送至高级别的 _capsule_,有了来自低级别 _capsule_ 的预测,高级别 _capsule_ 的活动向量具备较大的标量积。这使得高级别 _capsule_ 能够根据低级别 _capsule_ 的预测选择合适的实例化参数,从而提高了网络的表达能力和泛化能力。 在实际应用中,Dynamic Routing 机制可以用于图像识别、自然语言处理、语音识别等领域,提高网络的表达能力和泛化能力,从而提高了模型的性能和鲁棒性。 Dynamic Routing Between Capsules 是一种强大且灵活的神经网络结构,它能够学习到更 abstract 的实体表示,提高了网络的表达能力和泛化能力。这种结构可以应用于多种领域,提高模型的性能和鲁棒性。
2024-10-31 上传