简介
图像分类:根据图像的主要内容进行分类。数据集:
物体定位:预测包含主要物体的图像区域,以便识别区域中的物体。数据集:
物体识别:定位并分类图像中出现的所有物体。这一过程通常包括:划出区域然后对其中
的物体进行分类。数据集:
语义分割:把图像中的每一个像素分到其所属物体类别,在样例中如人类、绵羊和草地。
数据集:
实例分割:把图像中的每一个像素分到其物体类别和所属物体实例。数据集:
关键点检测:检测物体上一组预定义关键点的位置,例如人体上或者人脸上的关键点。数
据集:
关键人物
这种图列出了物体识别技术中的关键人物:; !;!!!;
"# $!! ; %& "' ; %& ()'*# ; %# *' ; !+ (,# ;
,% ; "* ; -./% ; ; (!$ ;
! ; 0! )# ; , ! ; 1! ! ; 2 ; (!
!#! ; !. /! ; 3'! % ; !! ! ; ' 4%% ;
,!!;'!';54%!;!5!; 4,!66
重要的 CNN 概念
7特征 (图案,神经元的激活,特征探测)
当一个特定的图案(特征)被呈现在输入区(接受域)中时,一个隐藏的神经元就被会被
激活。
神经元识别的团可以被进行可视化,其方法是: 1)优化其输入区,将神经元的激活
(deep dream)最大化;2)将梯度(gradient)可视化或者在其输入像素中,引导神经元
激活的梯度(反向传播以及经引导的反向传播)3)将训练数据集中,激活神经元最多的
图像区域进行可视化
2. 感受野 (特征的输入区)
输入图像区会影响特征的激活。换句话说,它就是特征参考的区域。
通常,越高层上的特征会的接受域会更宽,这能让它能学会捕捉更多的复杂 /抽象图案。
ConvNet 的架构决定了感受野是如何随着层数的改变而改变的。
8特征地图(9,,隐藏层的通道)