收稿日期:2019-08-21;修回日期:2019-10-23基金项目:国家文物“互联网+中华文明”示范项目(2018203)
作者简介:刘萍(1993-),女(通信作者),河北衡水人,硕士研究生,主要研究方向为模式识别、计算机视觉(1259135147@qq.com );杨鸿波(1977-),男,河北定州人,教授,博士,主要研究方向为模式识别、计算机视觉等;宋阳(1992-),男,湖北武汉人,硕士研究生,主要研究方向为机器视觉
.改进YOLOv3网络的海洋生物识别算法
扎马斯*
刘
萍
,杨鸿波,宋
阳
(北京信息科技大学自动化学院,北京100192)
摘
要:受到水下光线不均匀的影响,
水下图像存在颜失真和曝光不足等问题,这严重影响了水下目标识别精度。基于GAN 提出一种改进YOLOv3网络的海洋生物识别算法,该算法主要对YOLOv3网络作了以下改进:将训练好的
UGAN-P 的生成网络加入YOLOv3检测网络中,作为其增强网络。该算法改变了传统水下图像增强与目标检测分开
进行的现状,
使网络增强部分更有利于海洋生物识别准确度的提高。检测网络部分还通过K-means 聚类数据集中目标框大小来修正anchor box ,使得anchor box 更加符合数据集目标尺寸。同时,与Faster R-CNN 算法进行了实验对比。实验结果发现,
改进的YOLOv3网络相比YOLOv3网络的平均精度(mAP )提高了4.2%,召回率(recall )提高了7%;其检测速度为18fps ,是Faster R-CNN 网络检测速度的九倍。关键词:YOLOv3-
GAN ;YOLOv3;UGAN-P ;Faster R-CNN ;图像增强;目标识别与检测0
引言
近年来,基于水下机器人的目标识别被广泛应用于海洋牧场
的智能领域。然而,光线在水下传播过程中,其失真程度会随波长6.1祝福语
不同而发生改变,这导致拍摄的水下图像清晰度不高,
这种失真的图像使得目标检测算法的检测精度难以提高。同时,海洋生物目标
识别与检测算法的检测精度和速度往往难以同时满足要求。针对上述问题,传统海洋生物识别算法采用两步走的方式来提高检测准确度:先通过图像增强方法对水下图像进行增强处理以提升图像质量,再使用检测网络对增强后的图像进行模型训练。下面将从当前使用的水下图像增强方法和目标识别检测算法来展开介绍。
目前的水下图像增强方法主要分为两类:a )基于物理模型的方法[1]
,
端午节高速免费吗这种方法借鉴图像成像机理,通过研究水中悬浮颗粒对入射光的散射及吸收作用,植物的分类
建立合理的水下成像模型,在此基础上反演出未降质图像,但由于水下成像过程复杂多样,现有模型普遍存在参数过于简单、
通过性差的缺点,制约了这类方法的使用;b )基于非物理模型的方法,
它又分为基于传统的图像增强方法和基于深度学习的图像增强方法两种。传统的水下图像增强方法[2]
针对水下图像质量下降的表现,如对比度下降、偏、图像模糊等,选取
相应的图像增强技术,
灵活构建处理方案。基于深度学习的图像增强方法主要是用非监督式或半监督式的特征学习和分层特征提
取从实例中学习任务,
例如UGAN-P [3]水下图像增强网络。目前基于深度学习的目标检测与识别算法主要分为两大类:a )two stage 目标检测算法,它将检测问题划分为两个阶段,首先产
生候选区域
(region proposals ),然后对候选区域进行分类和位置精修,这类算法的典型代表有R-CNN [4]、Fast R-CNN [5]、Faster R-CNN [6]等;b )one stage 目标检测算法,它实现了检测和分类同时
进行,直接输出物体的类别概率和位置坐标值,比较典型的算法如YOLOv1[7]、YOLOv2[8]
、YOLOv3、SSD 和CornerNet 等。
对于传统检测算法存在的两个问题,
2014年Girshick 提出了R-CNN 算法,其目标检测系统概况如图1所示
。
该算法原理:a )输入一张图像,利用SS (selective search )算法自下而上提取大约2000个区域提议;b )使用卷积神经网络(CNN )计算每个提议的特征;c )使用特定的线性SVM 分类器对每个区域
进行分类。R-CNN 在PASCAL VOC2010上实现了53.7%的平均精度(mAP ),
在200类的ILSVRC2013检测数据集中,其mAP 为31.4%,比最佳结果为24.3%的OverFeat 有很大改进。R-CNN 使用SS 算法和CNN 代替传统目标检测使用的滑动窗口和手工特征
设计,
使得目标检测领域取得巨大突破,开启了基于深度学习目标检测的热潮。
目前对水下图像增强的研究,大多数是基于图像质量方面的
视觉效果提高,
从而忽略其在生活中的实际用途,即提高检测与识别的精度。而这种将水下图像增强和目标检测与识别分为两个任务
的研究,淘宝如何开店
限制了目前海洋生物识别领域的发展。通过上述启发,本文提出了一种改进的YOLOv3网络,该网络原理是将训练好的水下图
像增强GAN 的生成网络加入YOLOv3检测识别网络中,
同时对水下图像进行增强与检测,使得水下图像增强的目的性更加明确。
1
相关工作
1.1
安徽旅游景点two stage 识别算法
目标检测和识别的研究始于20世纪60年代,传统的目标检测方法一般分为三个阶段:首先在给定的图像上选择一些候选的区域,然后对这些区域提取特征,最后使用训练好的分类器如SVM 、AdaBoost 等进行分类。传统目标检测方法主要存在两个问题:a )基于滑动窗口的区域选择策略没有针对性,时间复杂度高;b )手工设计的特征对于多样性的变化没有很好的鲁棒性。
经典的R-CNN 存在以下几个问题:a )训练分多步进行。首先在数据集上训练CNN ,在目标检测
数据集上对训练好的CNN 微调;然后使用SS 算法对微调后的CNN 进行区域特征提取;最后训练SVM 分类器。
b )时间和空间开销大。训练SVM 和回归时使用网络训练特
征作为输入,
特征保存在磁盘上再读入,其时间开销较大。c )测试速度较慢。图片中每个区域建议框都作卷积处理。2015年,He 等人[9]提出SPPNet 用来解决R-CNN 中重复卷积问题,但仍然存在
R-CNN 中的问题,即训练分多步和空间开销大。同年,Girshick 又提出了Fast R-CNN ,该算法主要突破是引进了感兴趣区域池化(ROI pooling ),
并且使用多任务损失函数,将边框回归加入网络中训练,大大提高了网络的训练测试速度。基于VGG16的Fast R-CNN 模型在训练速度上比R-CNN 快大约九倍,比
SPPNet 快大约三倍,在VOC2012数据集上的mAP 约为66%。
2016年,Ren 等人提出了Faster R-CNN 检测识别算法,其核心思想是提出一种RPN (region proposal network )。其使用RPN 取代SS 算法提取区域框,不仅速度得到提高而且精确上也有很大提升。
如图2所示,该算法主要由两个模块组成:a )用于区域提取的RPN ;b )Fast R-CNN 检测器,它主要是利用RPN 提取的区域特征来
进行分类和定位
。
1.2one stage 识别算法
two stage 物体检测算法主要是通过区域提议(region proposal )
产生大量可能包含待检测物体的边界框(bounding box ),再用分类器去判断每个边界框里是否包含有目标,以及目标所属类别的概
率或者置信度。不同于上述算法,
2016年,Redmon 等人提出了一·
493·计算机应用研究2020年
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论