选自AnalyticsVidhya
作者:FAIZANSHAIKH
机器之心编译
参与:路雪、李亚洲、黄小天
时刻跟上深度学习领域的最新进展变的越来越难,几乎每一天都有创新或新应用。但是,大多
数进展隐藏在大量发表的ArXiv/Springer研究论文中。
为了时刻了解最新动态,我们创建了一个阅读小组,在AnalyticsVidhya内部分享学习成
果。我想和大家分享的是一项关于研究社区开发出的高级架构的调查。
本文包括深度学习领域的最新进展、keras库中的代码实现以及论文链接。为保证文章简明,
我只总结了计算机视觉领域的成功架构。
什么是高级架构?
相比于单一的传统机器学习算法,深度学习算法由多样化的模型组成;这是由于神经网络在构
建一个完整的端到端的模型时所提供的灵活性。
神经网络有时可比作乐高块,借助想象力你几乎可以用它建构从简单到复杂的任何结构。
我们可以把高级架构定义为一个具有良好记录的成功模型;这主要见于挑战赛中,比如
ImageNet,其中你的任务是借助给定的数据解决图像识别等问题。
正如下文所描述的每一个架构,其中每一个都与常见的模型有细微不同,在解决问题时这成了
一种优势。这些架构同样属于「深度」模型的范畴,因此有可能比浅层模型表现更好。
计算机视觉任务的类型
本文主要聚焦于计算机视觉,因此很自然地描述了计算机视觉任务的分类。顾名思义,计算机
视觉即通过创建人工模型来模拟本由人类执行的视觉任务。其本质是人类的感知与观察是一个
过程,它可在人工系统中被理解和实现。
计算机视觉任务的主要类型如下:
物体识别/分类:在物体识别中,给出一张原始图像,你的任务是识别出该图像属于
哪个类别。
近日,FaizanShaikh在AnalyticsVidhya发表了一篇题为《10AdvancedDeep
LearningArchitecturesDataScientistsShouldKnow!》的文章,总结了计算机视觉领
域已经成效卓著的10个深度学习架构,并附上了每篇论文的地址链接和代码实现。机器之
心对该文进行了编译,原文链接请见文末。