深度学习驱动的视觉跟踪：全面分析与评估

129 浏览量更新于2024-06-19 收藏 2.68MB PDF 举报

"这篇综述文章探讨了深度学习在视觉跟踪中的应用，涵盖了深度学习的基础、视觉跟踪方法、基准数据集以及评估指标。作者详细分析了当前基于深度学习的视觉跟踪技术，包括网络架构、训练策略、外观建模等多个方面，并对比了不同基准数据集的特性。此外，文章还对一系列先进方法进行了全面评估，讨论了它们在各种复杂情况下的性能，为研究人员和从业者提供了选择合适跟踪方法的指导，并指出了未来的研究方向。" 深度学习在视觉跟踪中的应用已经成为计算机视觉领域的热点，这是因为深度学习的强大表征能力和学习能力能够有效地处理视觉跟踪中的不确定性与复杂性。视觉跟踪，即在视频序列中持续定位和识别特定目标，面临光照变化、遮挡、目标形变等多种挑战。传统的跟踪方法如卡尔曼滤波、粒子滤波等在处理这些问题时可能力不从心，而深度学习则提供了一种强大的解决方案。深度学习在视觉跟踪中的应用主要体现在以下几个方面： 1. **网络架构**：深度神经网络，如卷积神经网络(CNN)和循环神经网络(RNN)，被用于提取特征，捕捉目标的外观和运动模式。CNNs在特征提取方面的卓越性能使其成为视觉跟踪任务的理想选择。 2. **网络开发**：深度网络通常需要大量的标注数据进行训练，但在视觉跟踪中，由于实时性和在线性的要求，往往采用迁移学习或者在线学习策略，使得模型能适应跟踪过程中目标的变化。 3. **视觉跟踪网络训练**：包括端到端的训练和在线微调，端到端训练可以全局优化网络，而在线微调则允许网络针对特定目标动态调整。 4. **网络目标**：深度学习模型通常需要明确的目标表示，例如，通过生成目标的实例级或类级表示来区分背景和目标。 5. **网络输出**：可以是目标的位置、形状、运动参数等，网络设计需要确保输出对跟踪性能的敏感性和稳定性。 6. **相关滤波器优势**：结合深度学习和传统滤波器方法，如高斯马尔可夫随机场(GMM)或最小二乘支持向量机(LSSVM)，可以提升跟踪性能。文章还详细比较了不同的视觉跟踪基准数据集，如OTB2013、OTB2015、VOT2018和LaSOT，每个数据集都有其独特特点和评价标准，这对于理解不同方法在实际场景中的表现至关重要。通过定量和定性的分析，作者揭示了各种方法的优势和局限性，这对于选择合适的技术进行实际应用或进一步研究极具参考价值。此外，文章提出了当前存在的问题和未来的研究方向，例如如何更有效地处理长期遮挡、快速运动和大规模外观变化，以及如何设计更加鲁棒和适应性强的深度学习模型。这为研究人员提供了新的思路，推动了视觉跟踪领域的进一步发展。这篇综述深入探讨了深度学习在视觉跟踪中的应用现状和未来趋势，对于研究人员、工程师和学生来说，是一份了解该领域前沿知识的重要参考资料。

CNN

HCFT

，

DeepSRDCF

，

FCN T

，

CNN-SVM

，

DPST

，

CCOT

，

MDNet

，

HDT

，

STCT

，

RPNT

，

CNT

，

RDLT

，

CREST

，

UCT/UCT_Lite

，

TSN

，

WECO

，

IBCCF

，

DTO

，

GNET

，

PF_HC FT

，

VRCPF

，

DCPF

，

ECO

，

DeepCSRD CF

，

MCPF

，

BranchOut

，

DeepLM CF

，

Obli-RaFT

，

ACFN

，

SAN et

，

DRN

，

DNT

，

STSGS

，

DNT

，

RT-MDNet

，

CPT

，

STP

，

WAEF

，

DeepSTRC F

，

DRT

，

LSART

，

MCCT

，

DCPF2

，

VDSR-SRT

、

IML CF

、

DAT

、

HCFTs

、

adaDDCF

、

YCNN

、

DeepHPFT

、

CFCF

、

P2T

、

LCTdeep

、

HSTC

、

DeepFW DCF

、

CF-CN N

、

MGNet

、

ORHF

、

ASRCF

、

RPCF

、

CODA

、

SMAR T

、

MRCN N

、

IMM _DFT

、

DeepTACF

，

DCDC F

，

CF-CN N

，

DeepTrack

，

TCNN

网络架构

暹罗网络

自定义网络

SiamFC

，

GOTURN

，

SINT

，

PTA V

，

DSiam/DSiamM

，

CFNrt

，

DCFNet/DCFN et2

，

DET

，

TripletLoss

，

DaSiamRPN

，

StructSiam

，

MM LT

，

Siam-MCF

，

Siam-

，

SiamRPN

，

SA_Siam

，

FlowTrack

，

RASNet

，

FCSFN

，

FRPN2T-S iam

，

FMFT

，

FICFN et

，

ATOM

，

C-RPN

，

GCT

，

SPM

，

SiamDW

，

SiamM ask

，

SiamRPN++

，

TADT

，

UDT

，

DiM P

，

MTHC F

，

CF- FCSiam

，

TAAT

ACT

、

TRACA

、

DCTN

、

CFSRL

、

DRRL

、

AEPCF

、

DRLT

、

EAST

、

P-Tracker

、

ADNet

、

DRL-IS

、

SINT+ +

、

RDT

、

C2FT

RNN FPRN et

，

RFL

，

MAM

GAN VITAL

、

TGGAN

、

ADT

深现成

的功能

HCFT

，

DeepSRDCF

，

FCN T

，

CNN-SVM

，

CCOT

，

HDT

，

RPNT

，

CREST

，

WECO

，

IBCCF

，

DTO

，

PF_HC FT

，

VRCPF

，

DCPF

，

ECO

，

DeepCSRD CF

，

MCPF

，

DeepLM CF

，

Obli-RaFT

，

STSGS

，

CIM T

，

MM LT

，

CPT

，

WAEF

，

DeepSTRC F

，

DRT

，

MCCT

，

DCPF2

，

VDSR-SRT

，

HCFTs

，

DeepHPFT

，

LCTdeep

，

DeepFW DCF

，

CF-CN N

，

ORHF

，

ASRCF

，

RPCF

，

TADT

，

IMM _DFT

，

DeepTACF

，

DCDC F

，

CF-FC Siam

网络开发

视觉上的深层特征

跟踪

DPST

，

GOTURN

，

SiamFC

，

SINT

，

MDNet

，

PTAV

，

UCT/UCT_Lite

，

DSiam/DsiamM

，

RFL

，

SRT

，

R-FCSN

，

GNET

，

LST

，

CFNet

，

BranchOut

，

ACFN

，

SANet

，

DCFNet/DCF Net2

、

TripletLoss

、

ACT

、

DaSiamRPN

、

RT-MDNet

、

StructSiam

、

STP

、

Siam-MCF

、

Siam-BM

、

TRACA

、

VITAL

、

SiamRPN

、

SA_Siam

、

FlowTrack

、

RASNet

、

FCSFN

、

FRPN2T-S iam

，

FMFT

，

IMLCF

，

TGGAN

，

DAT

，

DCTN

，

FPRNet

，

YCNN

，

CFCF

，

CFSRL

，

FICFN et

，

MGNet

，

ATOM

，

C-RPN

，

GCT

，

SPM

，

SiamDW

，

SiamM ask

，

SiamRPN ++

，

UDT

、

DiM P

、

ADT

、

CODA

、

DRRL

、

MRCN N

、

MTHC F

、

AEPCF

、

TAAT

、

MAM

、

DeepTrack

、

TCNN

、

STCT

、

CNT

、

RDLT

、

TSN

、

DET

、

DRN

、

DNT

、

DNT

、

LSART

、

adaDDCF

、

P2T

、

HSTC

、

SMAR T

、

SINT ++

、

RDT

、

P-Tracker

、

EAST

、

DRL-IS

、

C2FT

、

ADNet

、

DRLT

只有离线预培

训

GOTURN

，

SiamFC

，

SINT

，

R-FCS N

，

LST

，

CFNet

，

DaSiamRPN

，

StructSiam

，

Siam-BM

，

SA-Siam

，

SiamRPN

，

C-RPN

，

GCT

，

SPM

，

FICFN et

，

MTHC F

，

CFCF

，

CFSRL

，

SRT

，

IML CF

，

MAM

，

PTAV

，

UDT

，

DRRL

，

FCSFN

，

DiM P

，

Siam-MCF

，

SiamMask

，

SiamRPN++

，

SiamDW

，

FlowTrack

，

RASNet

，

ACFN

，

RFL

，

TGGAN

，

DCTN

，

YCNN

，

SINT+ +

，

RDT

，

EAST

，

C2FT

，

DRLT

视觉跟踪的网络训练

仅在线

培

训

SMAR T

，

TCNN

，

TSN

，

DNT

，

DALG

，

LSART

，

adaDDCF

，

HSTC

，

STC T

，

DeepTrack

，

CNT

，

RDLT

，

P2T

，

AEPCF

，

FRPN2T-Siam

，

P-Tracker

离线和在线培训

DRN

、

DSiam/DSiamM

、

TripletLoss

、

TAAT

、

DPST

、

MDNet

、

GNET|

、

BranchOut

、

SANet

、

RT-MDNet

、

TRACA

、

VITAL

、

DAT

、

ACT

、

MGNet

、

FMFT

、

DET

、

DCFNet/DCFN et2

、

STP

、

MRCN N

、

CODA

、

ATOM

、

UCT/UCT_Lite

、

FPRNet

、

ADT

、

DRL-IS

、

ADNet

基于回归

GOTURN

，

adaDDCF

，

CNT

，

UCT/U CT-Lite

，

DSiam/DSiamM

，

TSN

，

R-FCS N

，

CFNet

，

DCFNet/DCFN et2

，

DALG

，

TRACA

，

SA_Siam

，

FlowTrack

，

LSART

，

RASNet

，

IMLCF

，

DCTN

，

FPRNet

，

CFCF

，

FICFN et

，

HSTC

，

UDT

，

MTHC F

，

AEPCF

，

DRLT

网络

目

标

基于分类

DPST

，

SiamFC

，

SINT

，

STCT

，

DeepTrack

，

RDLT

，

CF-CN N

，

PTAV

，

RFL

，

GNET

，

LST

，

BranchOut

，

ACFN

，

DET

，

DRN

，

DNT

，

TripletLoss

，

StructSiam

，

STP

，

Siam-MCF

，

Siam- BM

，

VITAL

，

FCSFN

，

FRPN2T-S iam

，

TGGAN

，

YCNN

，

GCT

，

SiamDW_SiamFC

，

CODA

，

DRRL

，

MAM

，

EAST

，

P-Track

，

RDT

，

SINT+ +

，

ADNet

，

C2FT

基于

分类和回归

MDNet

、

TCNN

、

SRT

、

SANet

、

ACT

、

DaSiamRPN

、

RT-MDNet

、

SiamRPN

、

FMFT

、

DAT

、

CFSRL

、

P2T

、

MGNet

、

ATOM

、

C-RPN

、

SPM

、

SiamDW_SiamRPN

、

SiamMask

、

SiamRPN+ +

、

DiM P

、

ADT

、

SMAR T

、

MRCN N

、

TAAT

、

DRL-IS

置信度图

SiamFC

，

STCT

，

UCT/UCT_Lite

，

DSiam/DSiamM

，

TSN

，

RFL

，

R-FCSN

，

LST

，

CFNet

，

DCFNet/DCFN et2

，

DNT

，

TripletLoss

，

DALG

，

DaSiamRPN

，

StructSiam

，

STP

，

Siam-MCF

，

Siam-BM

，

TRACA

，

SA_Siam

，

FlowTrack

，

LSART

，

RASNet

，

FCSFN

，

FRPN2T-Siam

，

FMFT

，

IML CF

，

TGGAN

，

DCTN

，

adaDDCF

，

YCNN

，

CFCF

，

CFSRL

，

FICFNet

，

HSTC

，

ATOM

，

C-RPN

，

GCT

，

SiamDW_SiamFC

，

UDT

，

DiM P

，

ADT

，

SMAR T

，

MTHC F

，

MAM

边界框

GOTURN

、

SRT

、

FPRNet

、

P2T

、

SiamMask

、

SiamRPN++

、

DRLT

网络

输

出

标的得分

DPST

，

SINT

，

MDNet

，

DeepTrack

，

TCNN

，

PTA V

，

GNET

，

BranchOut

，

ACFN

，

SANet

，

DET

，

DRN

，

ACT

，

RT-MDNet

，

VITAL

，

DAT

，

MGNet

，

C-RPN

，

SPM

，

SiamM ask

，

SiamRPN+ +

，

DRRL

，

MRCN N

，

TAAT

，

MAM

，

P-Track

，

RDT

，

SINT+ +

，

ADNet

，

DRL-IS

行动

DRRL

，

EAST

，

ADNet

，

C2FT

，

DRL-IS

特征映射

CNT

、

RDLT

、

CF-CN N

、

SiamRPN

、

SiamDW_Siam RPN

、

CODA

、

AEPCF

、

IMM _DFT

分割模板

Siam M ask

相关滤波器优点的开发

DC F

方法

利用相关

滤波器

层

函数

HCFT

、

DeepSRDCF

、

FCNT

、

CCOT

、

HDT

、

PTAV

、

CREST

、

WECO

、

IBCCF

、

DTO

、

PF_HCFT

、

DCPF

、

ECO

、

DeepCSRD CF

、

MCPF

、

DeepLM CF

、

ACFN

、

STSGS

、

DALF

、

DALT

、

CPT

、

WAEF

、

TRACA

、

DeepSTRC F

、

DRT

、

LSART

、

MCCT

、

DCPF2

、

VDSR-

SRT

、

IML CF

、

HCFTs

、

DeepHPFT

、

CFCF

、

CFSRL

、

LCTdeep

、

DeepFWDCF

、

CF-CN N

、

ORHF

、

ASRCF

、

RPCF

、

CODA

、

SMAR T

、

AEPCF

、

IMM _DFT

、

DeepTAFC F

、

DCDC F

、

CF-FCSiam

、

P-Tracker

UCT/U CT_Lite

、

DSiam/DSiamM

、

CFNet

、

DCFNet/DCF2

、

FlowTrack

、

RASNet

、

adaDDCF

、

FICFN et

、

ATOM

、

TADT

、

UDT

、

MTHC F

图3：基于DL的视觉跟踪方法的分类。

分层特征，利用上下文信息或运动信息，以及选择更具区分

性和鲁棒性的深度特征。此外，基于DL的方法旨在有效地为

视觉跟踪系统训练DNN。他们的一般动机可以分为采用不同

的网络训练（例如，网络预训练、在线训练或两者）或处理

某些训练问题（例如，缺乏训练数据、训练数据上的过拟合

以及计算复杂性）。无监督训练是使用大量未标记样本的另

一种最新方案，可以通过根据上下文信息对这些样本进行聚

类，将训练数据映射到流形空间或利用基于一致性的目标函

数来执行。最后，基于DL的跟踪器的主要动机根据他们的学

习过程被分类为在线更新方案，长宽比估计，规模估计，搜

索策略，和提供长期记忆。

本文从网络结构、网络开发、视觉跟踪网络训练、网络目

标、网络性能、网络性能

输出，并利用相关滤波器的优点。基于DL的视觉跟踪方法的

拟议分类如图3所示。此外，其他重要的细节，包括预训练的

网络，骨干网络，利用层，深度特征的类型，手工制作和深

度特征的融合，训练数据集，跟踪输出，跟踪速度，硬件实

现细节，编程语言和DL框架将在本节中介绍。在本节中，不

仅对最先进的基于DL的视觉跟踪方法进行了分类，而且还对

这些方法的主要动机和贡献进行了分类，这可以为识别未来

方向提供有用的观点。

2.1

网络架构

尽管CNN已经被广泛用于基于DL的方法中，但近年来也主

要开发了其他架构来提高视觉跟踪器的效率和鲁棒性。根据

不同深部构造的技术程度，

深度视觉跟踪方法

剩余23页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

深度学习驱动的视觉跟踪：全面分析与评估

基于深度学习的目标视频跟踪算法综述

深度学习在目标视觉检测中的应用

路由matlab仿真代码-AI:使用深度强化学习解决视觉跟踪和视觉导航问题

基于深度学习的视觉目标跟踪算法浅析.pdf

深度学习硬件方案综述.pdf

人体动作识别与评价——区别、联系及研究进展.docx

计算机专业本科毕设——人脸识别系统

深度学习目标检测2019进展：方法解析与应用综述

小样本学习在图像分类中的应用：深度学习视角

深度学习驱动的视觉注意力检测进展与挑战

最新资源