深度学习驱动的2D-3D研究：单图三维人体姿态估计与血管分割新进展

需积分: 0 127 浏览量更新于2024-06-30 收藏 929KB PDF 举报

该资源是一份关于2018年11月的深度学习在2D和3D领域的最新研究进展的概述，特别关注那些不包含卷积神经网络（CNN）这一关键词的课题。文中提到了几篇研究论文，涉及从单一图像中推断三维人体姿势、血管等树状结构的深度语义实例分割以及行动识别中的局部和全局时空建模，还有一篇是关于使用眼底照片预测糖尿病黄斑水肿等级。 1. **基于深度学习的三维人体姿势估计** - 这项研究提出了一种新的深度学习框架，旨在从单个二维图像中推断出三维人体姿势。通过采用两阶段方法，首先利用具有两个分支的生成器分别提取信息。这种技术的进步对于计算机视觉和人机交互领域有着重要的意义，因为它可以增强虚拟现实和增强现实应用中的人物动作捕捉和重建能力。 2. **树状结构的深度语义实例分割** - 一篇由Kerry Halupka等人撰写的论文介绍了处理如血管这类树状结构的深度学习方法。他们开发了一个深度神经网络，能直接处理无序的中心线点，以确定结构的拓扑。提出的多任务损失函数使得网络能够学习无序排列的数据，并实现对复杂分支结构的实例分割。使用合成数据进行训练，并利用域随机化来适应真实世界的2D和3D数据，这种方法在血管分割等领域具有广泛的应用前景。 3. **STNet：行动识别中的局部和全局时空建模** - 何东亮等人提出了一种名为STNet的模型，它专门针对行动识别任务，强调了局部和全局时空信息的重要性。在深度学习模型中集成这样的建模能力可以提升视频分析和理解的准确性和效率，尤其在体育赛事、监控视频和社交媒体内容分析等领域有显著价值。 4. **从眼底照片预测糖尿病黄斑水肿等级** - Avinash Varadarajan等人提出了一种方法，使用眼底照片预测由光学相干断层扫描衍生的糖尿病黄斑水肿程度。这展示了深度学习在医疗影像诊断中的潜力，通过非侵入性的眼底照片就能辅助医生进行更准确的诊断，对糖尿病视网膜病变的早期干预和治疗具有重要意义。这些研究共同体现了深度学习在2D和3D领域的广泛影响力，它们不仅推动了技术的创新，还在医疗、计算机视觉和人工智能等多个领域提供了实际应用的可能性。随着深度学习模型的不断优化，我们可以期待未来在这个领域的更多突破。

20.

第

1808. 05205[pdf,

其他

] Cs

。简历

多伊

10.1016/j.media.2018.07.010

󰉁分割󰕲络构建数据󰴬常有限的医学图像分类

作者

:ken c. l. wong, tanveer Syeda-Mahmood, mehdi moradi

摘要

深部学习在医学图像分析󰴯显示出很好的结果

但由于缺乏󰴬常的注释

数据集

限制其全部潜。尽管使󰉁

imagenet

预先训练的分类模型进󰢩迁移学习可

以缓解这问题

但受限的图像和模型复杂性可能会导致必要的计算成本增加

和性能下降。由于许多常󰤁的形态特征通常由官的同分类任务共享

如果我们能提

取出这样的特征

󰉁有限的样本来改进分类

那就󰴬常有益。因此

在课程学习󰇹念

的启发下

提出种󰉁分割󰕲络特征构建医学图像分类的策󰉝。通过使󰉁对类似

数据进󰢩预训练的分割󰕲络作为分类任务

机可以先学习简单的形状和结构概念

然后再处󰇹通常涉及复杂的实际分类问题概念。󰉁我们提出的三维三类脑肿瘤类

型分类问题框架

我们在

191

个测试样本和

个训练样本中获得

82%

的准确率。

在应󰉁于

九级脏语义级别分类问题时

我们在

263

个测试样本和

108

个训练样本

中达到

86%

的准确率。介绍与

imagenet

预训练分类和从头开始训练的分类

的较。少

2018





提交

;

最初宣布

2018



。

本已被医学图像分析所接受

记本参考

医学图像分析

49 (2018) 105-116

21.

第

xiv:1808. 02084[pdf,

其他

] Cs

。简历

基于混合表示的场景合成的深层󰈿成建模

作者

张泽伟

杨振培

󰶹崇阳

罗杰

亚历

胡特

艾蒂安

武加

󰺯启兴

摘

提出种适󰉁于室内环境的深层󰈿成场景建模技术。我们的󰋴标是使󰉁前馈神

经󰕲络训练󰈿成模型

该神经󰕲络将先前的分布

(

如正态分布

)

映射到室内场景中

主要对象的分布。我们引种

对象排表示形式

根据对象的和形状属性

对对象的位置和向进󰢩建模。此外

我们的场景表示适󰉁于从数据库中选择的具有

同倍数

(

重复计数

)

的

对象。我们展示种有原则的法来训练这种模型

法

是将三维对象排表示和基于

图像的维图像表示的鉴别损耗结合起来。我们展示

场景表示的有效性和基准数据集上的深度学习法。我们还展示该󰈿成模型在场

景插值和场景完成中的应󰉁。少

2018





提交

;

最初宣布

2018



。

22.

第

1808. 01134[pdf,

其他

] Cs

。简历

ispa-net:

迭代语义对󰻗󰕲络

作者

:jogendra nath kundu, aditya ganeshan, ra hul m.v., aditya prakash, r.

venkatesh babu

摘

从单󰋴维图像中󰇹解和提取物体的三维信息是计算机视觉中的个基本问题。

在三维对象姿态估计任务中

最近基于数据驱动的深度神经󰕲络法缺乏具有三维关

键点和姿态注释的真实图像。从类认知中汲取灵感

注释者以三维

cad

模型为结构

参考

获取真实图像的基本真󰇹观点

;

我们提出个迭代语义

pose

对󰻗󰕲络

称为

imsa-net

。我们的法侧重于󰉁语义三维结构的规性

通过预测给定图像之间的视

点差异来解决细粒度姿态估计的任务。这种基于图像较的法还缓解数据稀缺性

问题

从󰖳提󰷼所提出的新对象类别的可扩展性

只需最少的注释。细粒度物体姿态

估计也得益于输图像对的学习空间描述符的对应关系。所提出的姿势对󰻗框架可以

󰉁在线渲染设置以及后差的󰴬统纸盒分类的有效性来改进其在连续迭代中的初始

姿态估计。这使得

ispa-net

能够在各种真实图像视点估计数据集上实现最先进的性能。

此外

我们还展示该法在多个应󰉁中的有效性。󰶳先

我们展示活动对象视点定

位的结果

以从只考虑单个图像作为姿态参考的类似姿态中捕获图像。其次

我们证明

学习的语义对应只使󰉁每个对象类的个部分注释的

模板模型来执󰢩监督的

部分分割传输的能。为󰻊励可重复的研究

我们发布我们提出的算法的代码。少

2018





提交

;

最初宣布

2018



。

:2018

在

acmmm

会议上接受。代码可在

https://github.com/val-iisc/iSPA-Net

23.

第

1807. 11929

条

[pdf ,

其他

] Cs

。简历

以󰙵我为中的空间记忆

作者

张

󰶹景德

严世成

惠伟

赵琪

冯家志

摘要

以󰙵我为中的空间记忆

(esm)

定义个存储系统

该系统从󰙵我中的󰤐

度对有关环境的空间信息进󰢩编码、存储、识别和回忆。我们介绍种󰉁于

esm

建

模的集成深度神经󰕲络体系结构。它学习估计世界的占󰉁状态

并逐步构建󰙵上󰖳下的

全球地图

从󰙵我中的观点在空间扩展的环境中。在探索过程中

我们提出的

esm

模型使󰉁重复神经󰕲络新基于局部观测的全局地图的信念。它还通过新的外

部存储增强本地映射

以在型环境中进󰢩󰲊期探索

对被访问位置的潜在表

示形式进󰢩编码和存储

从󰖳使代󰇹能够执󰢩位置识别

从󰖳实现循环关闭。我们提出

的

esm

󰕲络在以下个󰴯做出贡献

: (1)

在没有特征程的情况下

我们的模型

以端到端的式有效地预测基于󰙵我中视图的󰙵由空间

;(2)

同于其他基于深度学

习的映射系统

, esmn

处󰇹连续动作和状态

这对于实际应󰉁中的机控制󰙸关重要。

在实验中

我们通过与个竞争基线的较

证明它在三维虚拟迷宫和逼真室内环

境中具有准确、稳健的全局映射能。少

2018





提交

;

最初宣布

2018



。

:2018

接受

󰵎

, 6

位数字

24.

第

xiv:180. 7.09064[pdf,

其他

] Cs

。简历

漫画商店

个性化和逼真的漫画素描

作者

韩晓光

侯康成

董渡

邱󰇔达

于洲

周坤

崔树光

摘要

本提出种交互式个性化、逼真的󰴯部漫画素描系统。输脸的图像

󰉁

户可以通过操纵其󰴯部特征曲线来创建漫画照󰅧。我们的系统󰶳先根据编辑的草图对

恢复的

脸模型进󰢩夸张

通过为每个顶点的拉普拉斯分配个缩放因来实现。

为构造维草图与顶点缩放场之间的映射

提出种新的深度学习体系结构。󰉁

所获得的三维合成模型

󰈿成两个图像

个是在底层三维󰕲格变形的指导下应󰉁

维翘曲获得的

另个是通过重新渲染变形的三维纹󰇹获得的。模型。然后将这两个

图像缝集成

以󰈿成我们的最终输出。由于󰕲格的严重拉伸

渲染的纹󰇹是模糊的外

观。采󰉁深度学习法来推断缺失的细节

以增强这些模糊的区域。此外

还发明

种照明操作

以进步提󰷼结果的光现实主义。定󰮢和定性实验结果验证我们的素描

系统的有效性和我们提出的技术相对于现有法的优越性。少

2018





提交

;

最初宣布

2018



。

向

ieee tvcg

提交

󰵎

, 16

位数字

剩余44页未读，继续阅读

Jaihwoe

粉丝: 21
资源: 350

深度学习驱动的2D-3D研究：单图三维人体姿态估计与血管分割新进展

基于深度学习的研究进展1

2018下半年深度学习发展综述

Matlab codes for 2D Convolutional Neural Network.zip

TensorFlow卷积神经网络(Convolutional Neural Network)入门指南

如何详细地构建一个卷积神经网络（Convolutional Neural Network, CNN）模型？

基于深度学习的2D_3D医学图像配准研究.pdf

Convolutional-Neural-Network

convolutional neural net work matlab

This is a matlab-code implementation of convolutional neural

基于多列深度3D卷积神经网络的手势识别.pdf

最新资源