UniNet：高性能混合视觉架构搜索的新方法

156 浏览量更新于2024-06-19 收藏 1MB PDF 举报

UniNet：结合卷积、Transformer和MLP的高性能混合视觉架构搜索 UniNet 是一种新的统一架构的搜索方法，旨在结合卷积、Transformer 和 MLP，形成高性能的混合视觉架构。该方法包含两个关键的设计：一是使用统一的形式非常不同的可搜索的运营商建模，以减小搜索空间的大小和成本；二是提出上下文感知的下采样模块（DSM），以减轻不同类型的运营商之间的差距。 UniNet 的搜索算法基于强化学习，能够充分探索操作符的最佳组合。实验结果表明，UniNet 比以前的 ConvNets 和 Transformer 具有更高的准确性和效率。知识点1：混合视觉架构的重要性 UniNet 的出现是为了解决当前视觉任务中存在的挑战，即如何有效地结合卷积、Transformer 和 MLP 形成高性能的混合视觉架构。混合视觉架构可以结合不同类型的运营商，以提高视觉任务的准确性和效率。知识点2：可学习的组合卷积 UniNet 的搜索算法基于可学习的组合卷积，能够自动地搜索和组合不同的运营商，以形成高性能的混合视觉架构。这使得 UniNet 能够超越传统的 ConvNets 和 Transformer。知识点3：统一架构的搜索方法 UniNet 的统一架构的搜索方法可以减小搜索空间的大小和成本，提高搜索效率。这使得 UniNet 能够快速地搜索和组合不同的运营商，以形成高性能的混合视觉架构。知识点4：上下文感知的下采样模块（DSM） UniNet 的 DSM 能够减轻不同类型的运营商之间的差距，提高视觉任务的准确性和效率。DSM 的出现是为了解决当前视觉任务中存在的挑战，即如何减轻不同类型的运营商之间的差距。知识点5：基于强化学习的搜索算法 UniNet 的搜索算法基于强化学习，可以充分探索操作符的最佳组合。这使得 UniNet 能够搜索和组合不同的运营商，以形成高性能的混合视觉架构。知识点6：高性能的混合架构 UniNet 的实验结果表明， UniNet 比以前的 ConvNets 和 Transformer 具有更高的准确性和效率。这使得 UniNet 成为当前视觉任务中的一种高性能的混合视觉架构。知识点7：深度学习架构和神经架构搜索 UniNet 的出现是为了解决当前深度学习架构和神经架构搜索中的挑战，即如何有效地结合卷积、Transformer 和 MLP 形成高性能的混合视觉架构。 UniNet 的搜索算法基于强化学习，能够充分探索操作符的最佳组合，以形成高性能的混合视觉架构。

+v：mala2255获取更多论

文

×�

输入图

像

共和

党

DSM

共和

党

DSM

…

共和

党

统一搜索空间：

政府办事处：

•

卷积

L-DSM

•

Transformer

G-DSM

•

MLP

LG-DSM

尺寸：

•

重复

•

渠道

•

膨胀

UniNet 5

输出

图2：

统一架构搜索。

我们联合搜索不同类型的操作者以及下采样模块

（DSM）和网络大小在一个统一的搜索空间。我们以多阶段的方式构建

UniNet架构。在两个连续的阶段之间，插入DSM中的一个以改变空间维

度或通道。

方法

3.1

统一架构搜索

正如在以前的工作中所讨论的那样，卷积和Transformer算子的适当组

合可以提高性能。然而，以前的方法[51，53]仅在自注意或前馈网络

（FFN）子层中采用卷积并重复堆叠它们。他们的方法并没有充分探

索这些组合，以利用它们不同的特性。

现有技术[49，56]表明下采样模块在视觉任务中起着重要作用。大

多数先前的方法采用手工制作的下采样操作，即，步幅卷积、最大池

化或平均池化，以仅基于局部上下文对特征图进行下采样。然而，这

些操作是专门为ConvNets设计的，可能不适合基于Transformer或MLP

的架构，这些架构全局捕获表示。

在本文中，我们研究了卷积，trans-former和MLP的可学习组合为了

更好地在不同的操作块之间传输特征，我们提出了上下文感知的下采

样模块。我们在一个统一的搜索空间中联合搜索算子、下采样模块和

网络大小相比之下，以前的神经结构搜索（NAS）工作主要通过搜索

网络大小来实现最先进的性能。我们发现，我们的统一架构搜索方法

搜索的混合架构可以实现非常有前途的性能。

在本节的其余部分中，我们首先介绍了如何将不同的算子适当地

定义到一个统一的搜索空间中并联合搜索它们。然后，我们提出了将

下采样模块与不同的挑战-

这里，MLP指的是捕获空间表示的MLP样式子层[41，42，20]，而不是

纯1

1卷积。

剩余23页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

UniNet：高性能混合视觉架构搜索的新方法

基于卷积网络的图像检索代码

联通APN是怎么配置的

使用GA6-B短信模块之前，需要进行哪些配置，例如APN,用户名，密码之类

全球运营商apn 参数合集

帮我写一篇 Unity的UDP通信脚本，要求接收和发送使用同一个端口号

卡通风格化魔法术技能粒子特效 ：Toon Projectiles 2 1.0

在 MATLAB GUI 中动态更新数据：策略与实践

【JCR一区级】Matlab实现白鹭群优化算法ESOA-CNN-BiLSTM-Attention的故障诊断算法研究.rar

信创实验室建设方案（24页）.pptx

KGBrowserSetup-x86-V1.0.0.100-20190315.exe

最新资源

卡通风格化魔法术技能粒子特效：Toon Projectiles 2 1.0