基于改进YOLO和迁移学习的水下鱼类目标实时检测.pdf_迁移学习中怎么进行测试

yolo

目标检测

需积分: 26 136 浏览量更新于2023-03-03 评论 5 收藏 1.4MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

资源详情

资源评论

资源推荐

摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇

基

于改进 YOLO 和迁移学习的

水下鱼类目标实时检测

李庆忠

摇摇李宜兵

摇摇牛摇炯

摘摇要摇为了实现非限制环境中水下机器人基于视频图像的水下鱼类目标快速检测,提出基于改进 YOLO 和迁移

学习的水下鱼类目标实时检测算法. 针对 YOLO 网络的不足,设计适合水下机器人嵌入式系统计算能力的精简

YOLO 网络(Underwater鄄YOLO). 利用迁移学习方法训练 Underwater鄄YOLO 网络,克服海底鱼类已知样本集有限的

限制. 利用基于限制对比度自适应直方图均衡化的水下图像增强预处理算法,克服水下图像的降质问题. 利用基于

帧间图像结构相似度的选择性网络前向计算策略,提高视频帧检测速率. 实验表明,文中算法能实现在非限制环境

下海底鱼类目标的实时检测. 相比 YOLO,文中算法对海底鱼类小目标和重叠目标具有更好的检测性能.

关键词摇卷积神经网络, 深度学习, 鱼类目标检测, 单级式目标检测算法( YOLO), 迁移学习

引用格式摇李庆忠,李宜兵,牛炯. 基于改进 YOLO 和迁移学习的水下鱼类目标实时检测. 模式识别与人工智能,

2019, 32(3): 193-203.

DOI摇 10. 16451 / j. cnki. issn1003鄄6059. 201903001摇摇摇摇摇摇中图法分类号摇 TP 181

Real鄄Time Detection of Underwater Fish Based on

Improved YOLO and Transfer Learning

LI Qingzhong

, LI Yibing

, NIU Jiong

ABSTRACT 摇 To fast detect underwater fish in unrestricted underwater environment based on

underwater video collected by underwater robots, a real鄄time detection algorithm for underwater fish based

on improved you only look once(YOLO) and transfer learning is proposed. Firstly, an underwater鄄YOLO

for the embedding computer system of underwater robots is designed to overcome the shortcomings of

traditional YOLO. Then, transfer learning strategy is employed to train the underwater鄄YOLO network

and alleviate the limitation of known underwater fish samples. A preprocessing algorithm based on

contrast limited adaptive histogram equalization is proposed to overcome the problem of underwater image

degradation. Finally, a video frame selection method for foreground computation of underwater鄄YOLO

based on structure similarity between inter鄄frames is proposed to increase the detection frame rate. The

experimental results show that the proposed algorithm achieves the goal of real鄄time detection of

underwater fish in unconstrained underwater environment. Compared with the traditional YOLO, the

proposed underwater鄄YOLO generates better detection performance in complex scenes with small fish and

overlapped fishes.

Key Words摇 Convolutional Neural Network, Deep Learning, Fish Target Detection, You Only Look

Once( YOLO), Transfer Learning

收稿日期:2018-11-14;录用日期:2019-03-13

Manuscript received November 14, 2018;

accepted March 13, 2019

国家重点研发计划项目(No. 2017YFC1405202)、国家自然科

学基金项目(No. 61132005)、海洋公益性行业科研专项(No.

201605002)

Supported by National Key R&D Plan of China(No. 2017YFC14

05202), National Natural Science Foundation of China ( No.

61132005 ), National Marine Technology Program for Public

Welfare of China (No. 201605002)

本文责任编委叶东毅

Recommended by Associate Editor YE Dongyi

1. 中国海洋大学工程学院摇青岛 266100

1. College of Engineering, Ocean University of China, Qingdao

266100

第 32 卷摇第 3 期模式识别与人工智能 Vol. 32摇 No. 3

2019 年 3 月 Pattern Recognition and Artificial Intelligence Mar. 摇 2019

摇摇摇摇摇

摇摇摇摇

摇摇摇摇摇

摇

《模式识别与人工智能》电子版

Citation摇 LI Q Z, LI Y B, NIU J. Real鄄Time Detection of Underwater Fish Based on Improved YOLO

and Transfer Learning. Pattern Recognition and Artificial Intelligence, 2019, 32(3): 193-

203.

摇摇深海探测与作业技术是海洋技术研究的重要领

域之一. 水下机器人(有缆水下机器人( Remote Ope鄄

rated Vehicles, ROVs) / 无缆水下机器人 ( Autono鄄

mous Underwater Vehicles, AUVs) 是目前最先进的

深海探测与作业装备. 要实现深海探测与作业,水下

机器人必须能快速识别理解海底环境,并对感兴趣

的目标进行准确识别与定位

[1-4]

. 因此,利用装有水

下摄像机的 AUVs 对水下感兴趣目标进行实时搜

寻、监测具有重要研究价值和应用前景. 本文目标就

是研究海底非限制环境下基于视频图像的鱼类目标

的快速检测算法,为海底鱼类等生物资源的监测、保

护及可持续开发提供技术支持.

在地面非限制环境下,感兴趣目标的检测算法

发展迅速,在检测精度和实时性方面已接近实用性.

其主要原因是基于深度卷积神经网络 ( Deep

Convolutional Neural Network, DCNN)的目标检测算

法可有效克服非限制环境目标检测的困难和瓶颈.

其主流方法可分为如下两类.

1) 基于区域卷积神经网络 ( Region Convolu鄄

tional Neural Network, R鄄CNN)深度学习的目标检测

方法. Girshick 等

[5]

提出 R鄄CNN,由于 R鄄CNN 在所

有候选区域中重复进行特征提取,影响目标检测的

效率,所以快速区域神经网络( Fast R鄄CNN)

[6]

采用

直接在特征图像上产生候选区域的方式,避免反复

进行特征提取,提高目标检测效率. 超快区域神经网

络(Faster R鄄CNN)

[7]

直接使用候选区域生成网络

(Region Proposal Network, RPN)产生召回率更高的

候选区域,平均准确率更高,处理速度更快.

2)基于单级式目标检测算法( You Only Look

Once, YOLO)深度学习目标检测算法. 为了克服 R鄄

CNN 的目标检测算法实时性差的问题, Redmon

等

[8]

提出 YOLO,摒弃候选区域生成的中间步骤,将

目标区域预测和目标类别预测整合在单个 DCNN

模型中. 在 YOLO 基础上 Redmon 等

[9]

提出 YOLOv2

(YOLO Version 2, YOLOv2),采用诸多改进策略,提

高平均准确率和运行速度. 在 YOLO 基础上,

Redmon 等

[10]

又提出 YOLOv3 算法( YOLO Version

3, YOLOv3) ,在特征提取阶段,采用浅层次特征和

深层次特征的融合,提取更具鉴别性的深层特征. 对

于 Microsoft COCO 数据集

[11]

,准确率与 SSD 算法

(Single Shot MultiBox De鄄tector, SSD)

[12]

相当,处理

速度为 SSD 的 3 倍.

虽然地面目标的实时检测算法已较完善,但在

水下非限制环境中,水下感兴趣目标的实时检测仍

面临许多挑战,其主要原因是水下介质、水下光照条

件、水下海底环境等都要比地面机器人面临的环境

复杂. 对于基于水下视觉的鱼类目标检测,目前代表

性的研究方法主要分为如下 3 类.

1)基于水下图像底层特征的鱼类目标检测算

法. Hsiao 等

[13]

提出真实水下非限制环境中鱼类目

标的检测识别算法,通过提取水下图像的各种底层

特征,并利用稀疏表达技术设计分类器进行鱼类目

标的辨识, 识别率可达 81. 8% , 但实时性较差.

Cutter 等

[14]

利用 Haar鄄like 特征和多个级联分类器

实现海底非限制环境下岩石鱼类目标的检测,检测

率可达 89% ,但对于鱼类非正常姿态、背景复杂、光

照条件恶劣、噪声过大、分辨率较低等非限制环境的

检测结果并不理想,误检率较高.

2)基于 R鄄CNN 深度学习的鱼类目标检测算法.

Seese 等

[15]

提出鱼类目标检测分类算法,首先利用

融合技术估计背景图像并实现鱼类前景区域的分

割,然后对于分割的鱼类前景区域, 再利用 DCNN

自动提取特征与分类. Li 等

[16]

改进 Faster R鄄CNN 的

结构,提出适合水下鱼类目标检测的轻型 R鄄CNN,

虽然检测率可达 89. 95% , 但实时性仍欠佳, 仅

为11 帧 / 秒.

3)基于 YOLO 深度学习的鱼类目标检测算法.

Sung 等

[17]

把一般地面目标实时检测的 YOLO 网络

结构模型移植到水下鱼类目标的检测,利用特定的

水下视频作为训练、测试数据集,取得较好的分类精

度和实时性,但缺乏考虑水下机器人的实际硬件限

制和水下光照环境的复杂多变性.

通过上述分析可知,目前对水下非限制环境中

基于视觉的鱼类目标的检测主要存在如下三方面问

题. 1)由于光在水体介质中存在严重的衰减和散射

效应,造成水下图像质量下降,为水下鱼类目标的特

征学习、识别理解造成严重障碍. 2) 由于海底鱼类

目标大多具有未知性,鱼类目标在自动识别学习时,

已知标签的样本数量非常有限,传统的训练学习方

法不再适用. 3)水下机器人研制采用嵌入式计算机

系统,相比一般台式计算机,硬件运算能力具有较大

的限制性. 因此,基于 YOLO 等深度学习的地面目标

491

模式识别与人工智能(PR&AI)摇摇摇第 32 卷

《模式识别与人工智能》电子版

实时检测算法不再适合水下机器人的嵌入式系统.

为了克服上述问题,本文提出基于改进 YOLO

和迁移学习的水下鱼类目标实时检测算法. 针对

YOLO 网络结构进行改进,提出适合水下机器人嵌

入式系统的精简 YOLO 结构(Underwater鄄YOLO) ,可

以胜任水下鱼类目标的实时检测要求. 针对网络训

练时样本不足的问题, 采用迁移学习的方法训练

Underwater鄄YOLO 网络. 针对水下海底图像散射模

糊、对比度较低、光照不均问题,提出基于限制对比

度自适应直方图均衡化 ( Contrast Limited Adaptive

Histogram Equalization, CLAHE) 的水下图像增强预

处理算法. 此外, 提出基于图像结构相似度

(Structural Similarity, SSIM)的视频帧选择性网络前

向计算策略,有效提高检测速率.

1摇 YOLO 实时目标检测算法

YOLO 目标检测算法将目标检测问题转化为一

个回归问题,仅使用一个深度卷积神经网络模型进

行目标检测,能以较高的准确率实现快速目标检测

与识别.

YOLO 的网络结构如图 1 所示. 由图 1 可知,

YOLO 网络结构主要包括两部分. 1) 特征提取. 利用

一个具有 20 个卷积层的基础网络提取输入图像的

特征,可从大小为 448伊448伊3 的彩色图像中提取 14

伊14伊1 024 维特征. 2)回归预测. 使用随机初始化权

值的 4 层卷积进一步运算特征,产生维度为 7伊7 伊1

024 维包含特征,然后使用4 096个尺寸为 7 伊7 的卷

积核将特征矩阵进行二维卷积操作,产生 4 096 伊1

维全连接特征,通过全连接层产生 539 伊1 维输出特

征,将输出特征重排为 7伊7伊11 维,作为回归的输出

矩阵.

!"#$

20%

448

()*+

(),-

1024

4096

539

./01

./23

图 1摇 YOLO 网络结构

Fig. 1摇 Network structure of YOLO

回归输出矩阵包含目标边界框的尺寸和坐标、

边界框内包含目标的概率及目标所属类别. 这些信

息的编码方式如图 2 所示.

图 2 为输出矩阵第 1、2 维度取 1 时,第 3 维度

的编码信息,即一个图像块的编码信息. 目标检测结

果以边界框选中目标的方式呈现,其中, x、y 为边界

框中心点相对于网格左上方的偏移量,w、h 为边界

框的宽度和高度. C 为边界框内包含目标的置信度,

编码结果给出两个边界框的预测值,根据置信度 C

选择合理的边界框. P(c) 为被检测目标属于某一类

别的概率,为目标检测结果确定类别.

YOLO

x,y,w,h

P c

( )

图 2摇 YOLO 输出矩阵信息编码

Fig. 2摇 Coding mode of output matrix information of YOLO

将训练样本的标注信息处理成为输出矩阵的编

码顺序,可以建立理想输出与实际输出的损失函数.

坐标预测的损失函数如下:

loss

coord

移

i = 0

移

j = 0

obj

[ (

- x

卒

)

(

+ y

- y

卒

)

]

移

i = 0

移

j = 0

obj

[ (

- w

卒

)

(

+ h

- h

卒

)

]

(1)

预测网格框包含目标时的损失函数:

loss

obj

移

i = 0

移

j = 0

obj

[ (

- C

卒

)

]

预测网格框不包含目标时的目标函数:

loss

noobj

移

i = 0

移

j = 0

noobj

[ (

- C

卒

)

]

预测目标类别的损失函数:

loss

class

移

i = 0

obj

移

c沂

[

class

卒

]

)

综合部分的损失函数求得总损失函数:

loss = 姿

coord

·loss

coord

+ loss

obj

+ 姿

noobj

·loss

noobj

+ loss

class

以损失函数作为卷积神经网络的优化准则,利

用随机梯度下降法进行优化,即可完成 YOLO 网络

的训练.

591

第 3 期摇摇摇摇李庆忠摇等:基于改进 YOLO 和迁移学习的水下鱼类目标实时检测

《模式识别与人工智能》电子版

剩余10页未读，继续阅读

AI研习图书馆

粉丝: 1w+
资源: 17

会员权益专享

基于改进YOLO和迁移学习的水下鱼类目标实时检测.pdf

评论0

会员权益专享

最新资源

基于改进YOLO和迁移学习的水下鱼类目标实时检测.pdf

评论0

yoloV4.pdf

opencv+vc对检测移动物体源代码

迁移学习 目标检测

YOLO和迁移学习的关系

基于yolo的目标检测

基于改进YOLO v5

yolo从入门到精通.pdf下载

目标检测算法yolo改进方向

基于yolo目标检测人物

yolo 伪装目标检测

基于YOLO的ros平台目标检测

基于深度学习的航拍图片目标检测yolo

yolo旋转目标检测

yolo昆虫目标检测

目标检测yolo改进指南

jetson yolo7实时目标检测

基于yolov5改进的车辆目标检测.docx

基于yolo算法的目标检测毕设

yolo如何对屏幕目标实时检测

目标检测yolo学习基础

会员权益专享

最新资源

迁移学习目标检测