基于卷积神经网络的AUV水下识别算法设计与实现
Vol. 43, No. 4Apr., 2021
第43卷第4期
2021年4月
舰船科学技术
SHIP  SCIENCE  AND  TECHNOLOGY
基于卷积神经网络的AUV 水下识别算法设计与实现
李昱,王俊雄
(上海交通大学,上海201100)
钢板规格
摘 要:自主式水下机器人(AUV)是应用于复杂海洋环境中的高智能化无人装备,其需要具备良好的环境
感知能力进行自主导航,包括水下目标识别能力。随着人工智能的高速发展,卷积神经网络作为图像处理领域的深
度学习架构,在图像特征提取和图像识别上有着强大的性能和卓越的优势。本文利用卷积神经网络,实现了自主式
水下机器人水下目标的自主识别。同时,通过采用三段式全连接方式和增加卷积层深度的方式对卷积神经网络进行
进一步改进,提高了卷积神经网络的训练速度、准确率和泛化能力。
关键词:自主式水下机器人;自主导航;卷积神经网络;水下目标识别
中图分类号:TP273 文献标识码:A
文章编号:1672 - 7649(2021)04 - 0155 - 04 doi : 10.3404/j.issn.l672 - 7649.2021.04.031
Design  and  implementation  of  AUV  underwater  recognition  algorithm
based  on  convolutional  neural  network
LI  Yu, WANG  Jun-xiong
(Shanghai  Jiaotong  University, Shanghai  201100, China)
Abstract: Autonomous  underwater  vehicle(AUV) is  working  in  complex  marine  environment  as  a  highly  intelligent
unmanned  equipment. It  must  be  provided  with  the  key  ability  of  the  environment  perception  for  autonomous  navigation, in ­
cluding  underwater  target  recognition. With  the  rapid  development  of  artificial  intelligence, Convolutional  Neural
Network(CNN), as  a  deep  learning  architecture  in  the  field  of  image  processing, has  strong  performance  and  superior  advant ­
ages  in  image  feature  extraction  and  image  recognition. In  this  paper, by  the  application  of  CNN  in  AUV, the  autonomous
underwater  target  recognition  is  realized. At  the  same  time, further  improvement  of  CNN  is  provided, by  using  three-stage  fully  connection  and  increasing  the  depth  of  convolution  neural  network, and  the  training  speed, accuracy  and  generalization
of  CNN  are  improved.
Key  words: autonomous  underwater  vehicle  ; autonomous  navigation ; convolutional  neural  network ; underwater
target  recognition
0引言
由于自主式水下机器人(AUV)在海事研究和海 洋开发中具有远大前景,在未来水下信息获取、精确 打击和“非对称情报战”中也有广泛应用,因此自主
式水下机器人技术在世界各国都是一个重要和积极的
研发领域⑷。AUV 导航系统一直是近几年的研究重 点,AUV 需要通过导航系统实现高精度自主导航。
AUV 基本惯性导航系统一般采用捷联式惯导,由于 AUV 特殊的工作环境限制和惯性器件产生的固有漂移 误差,单一的导航设备无法满足AUV 长期高精度导航
的需求,需要采用组合导航系统。AUV 在远距离端一
般采用水声引导的方法,或者采用惯性导航系统和多
普勒速度计程仪组合导航的方法接近目标物,AUV 对
远距离端导航精度要求并不高,而近距离端导航定位
才是AUV 进行水下目标探测的关键叫 目前,用于水
下测量的传感器有:惯性导航传感器、声呐传感器和
视觉传感器等。其中,惯性导航传感器测出的是水下
机器人的相对位置,由于累计误差的产生,其精度会
随着时间的推移而下降,一般应用于水下的远距离端 导航;声呐传感器分为长基线、短基线和超短基线等
收稿日期:2019- 11 - 15
作者简介:李昱(1994-),女,硕士研究生,主要研究方向为计算机视觉。
•156•舰船科学技术第43卷
Feature Feature Feature Feature Feature
maps
64@50x50
maps
I28@25x25
maps
128@12“2 maps
64@2545
Inputs maps maps
3@100x|0032@1OOx j0032@50x50
Feature
Convl-Relul Max-poolong Conv2-Relu2Max-pooling Conv3-Reki3Max-pooling
5x5kernel2><2kernel5^5kernel2x2kernel3沢3kernel2^2kernel Hidden
units Outputs
184322
Flatten Fully
connected
图1卷积神经网络网格图Fig.1Convolution neural network grid
类型,但其测量精度较差,不适用于复杂的水下环境。视觉传感器是近几年兴起的传感器,其成本低,体积小、运动方式灵活,适用于局部的精确定位,是近几年来各国的重点研究方向。AUV的水下视觉引导一般是通过摄像机来获取目标物信息,从而进行目标物识别与测距定位叫
水下目标自动识别是目前水下识别技术的主要研究领域,如何对图像进行特征提取是目标识别的重点研究内容。基于深度学习的发展,卷积神经网络广泛应用于物体检测、动作识别、图像分类识别等领域,能有效提取特征,性能远远优于传统方法⑷。基于卷积神经网络的视觉导航系统能够使AUV对目标观测物进行自主识别,大幅提升AUV的图像特征提取和图像识别能力,实现近距离对目标物的精准定位
1卷积神经网络设计
本文采用卷积神经网络对矩形木框和三角形木框进行分类,数据集来自水下对三角形木框和矩形木框的图像采集,采用1340个大小为100X100的RGB图像,在此基础上设计卷积神经网络网格图如图1所示。
本文设计的卷积神经网络共有9层,有关矩形木框和三角形木框识别的详细过程如下:
1)输入层
利用双线性插值算法对原始输入图像进行缩放处
理,把图像大小缩放为lOOxlOOo
2)Convl-Relul层
怎样拍一拍Convl-Relul层是一个特征提取层,利用32个5x5的卷积核对原始图像进行卷积计算,提取特征,并获得32个100x100特征图。在第一层卷积层,本文采用32个5x5大小的卷积核对输入层大小为100X 100的图像分别进行卷积计算,提取特征,卷积核步长设置为1,采用图像边缘自动补零的方法对输入图像进行卷积计算,最终得到32个大小为100x100的特征图。本文拟采用ReLU激活函数对卷积结果进行激活,计算公式如下式:
Yi=ReLU(a)X+b1)o(1)
式中:X为输入图像,人为Convl-Relul层输出特征图,3为卷积核,久为偏置项,制造噪声,增强鲁棒性,最终得到Convl-Relul层特征图。
3)Max-pooling层
该层是子采样层,对Convl-Relul层得到的32个100x100特征图进行二次特征提取。本文采用32个2x2大小的卷积核分别对Convl-Relul层得到的32个100x100特征图进行卷积计算。卷积核移动步长为2,采用图像边缘不自动补零的方法,最终得到32个50x50大小的特征子图,如式(2)所示,即采用2倍速对特征图进行缩放。缩小的速度过快会使得得到的特征图过于粗糙,缩小的速度过慢会使得计算量过大。为了得到更多图像细节⑺,一般缩放因子设为2。为了能够有效控制特征图的缩放速度,之后的子采样过程的缩放因子也都设为2。
丫2=加诚^£冃(X订)+b。⑵
4)Conv2-Relu2层
为了更好地提取出图像的局部特征,扩展神经元的感受野,本文对Max-pooling层得到的特征子图像进行二次卷积操作,本层采用64个5x5大小的卷积核,移动步长为1,图像边缘自动补零,遍历整个特征
子图,最终得到64个50x50大小的特征图。通过前两层操作后,神经元的感受野较原始输入图像扩展为10x10,经过本层操作后,每一个神经元的感受野又增加5倍,扩展为50x50,同时特征图个数也增加了一倍,增加至64个。
5)Max-pooling层
鱼鳔的做法该层同样是子采样层,对Conv2-Relu2层得到
第43卷李 昱,等:基于卷积神经网络的AUV 水下识别算法设计与实现
• 157 •
64个50x50特征图进行二次特征提取。为了控制图像
的缩放速度,同样采用64个2x2大小的卷积核,卷积 核移动步长为2,采用图像边缘不自动补零的方法,
遍历Conv2-Relu2层得到的64个50x50特征图进行卷
积计算,最终得到64个25x25大小的特征子图。
6 ) Conv3-Relu3 层
为了增加CNN 的深度,提高分类的准确性,本文
继续采用128个3x3大小的卷积核遍历上一层得到的
特征图。卷积核的移动步长同样设为1,采用边缘自
动补零的方式对上一层得到的特征图进行进一步卷积
操作,得到128个大小为25x25的特征图,增加了卷
积神经网络的深度。
7)全连接层和输出层
经过6层卷积池化操作后,得到128个大小为
12X12的特征图,全连接层将上一层所得的特征图像
组合成列向量,最后通过softnax 函数对图像进行二分类叫
2实验与测试
本文所使用的图像数据集是来自水下对矩形木框
和三角形木框不同角度的拍摄图片,数据集包含有1340 张图片。实验通过TensorFlow 软件完成,Linux 操作系
统,Intel  i7-4710CPU,主频 3.00 GHz, 8G  内存,显
卡 GTX860。
通过上述设计的卷积神经网络进行训练和测试,
可以得到训练损失随着训练迭代次数的增多而降低, 测试准确率也随之提高。当训练迭代的次数达到一定 时,测试的准确率和损失相对处于一个平稳的状态。
由图2训练损失值图和准确率图可得,经过100次
女装名牌迭代训练后,卷积神经网络的训练损失值下降为10,
补办身份证需要什么手续
训练准确率达到90%,变化较缓慢,且测试集精确度
不高,卷积神经网络的泛化能力弱。为了将分布式特
层和池化层,增加训练深度,卷积神经网络如图3所示。
图2训练结果图
Fig. 2 Training  results
采用三段式全连接方式,对卷积神经网络进行训
练,如图3所示。在FC1层中,输入的神经元数量为
6*6*128=1608个,设置输出的神经元数量为1024个,
对权重进行dropout 函数操作和L2正则化,降低过拟
合现象,采用ReLU 激活函数进行激活,在FC2层 中,同样对权重进行dropout 正则化,将神经元缩减为
512个,在FC3层中,采用sofhnax 函数对输入进行二
分类。
训练准确率如图4所示。比较两图可以得到,在
本次试验中,经过90次训练迭代后,网络基本收敛, 网络迭代了 100次,卷积神经网络结构参数优化后的
测试损失值为5.8%,准确率达到99.18%o
同时对比2次测试集精确度,如图5所示。加入
3层全连接后,对权重参数进行dropout 正则化后,测
征图映射到样本标记空间,减少特征位置对分类带来
试集精度提高,卷积神经网络的过拟合现象降低,泛的影响,本文采用了3层全连接层,并增加一层卷积
化能力增强。
Hidden  units  4608
Hidden  units  1024Hidden  units 512
Outputs
2
Feature  maps
64@25*25Feature  maps  I28@25x25Feature  Feature
maps  maps
128@l2xl2 128@12x 12Feat l ire  maps  128@6^6Feature  Feature  Feature Inputs
maps  maps  maps
3@100xl00
32@ 100x|00 32@50^50 64@50>50Convl-Relul  MaK-poolong  Con 、
2・Rdu2 Max-poo!ing  ConvRelu3 Max-pooling  Conv4-Relu4 Max-pooling 5X 5 kernel  2*2 kernel  5X 5 kernel  2X 2 kernel  3X 3 kerne! 2X 2 kernel  kernel  2X 2 kernel
\\\
Flatten  Fully
Fully  Fully深圳东部华侨城好玩吗
connected  corinecled  connected
图3改进卷积神经网络网格图
Fig. 3 Improved  convolution  neural  network
grid
• 158 •
舰船科学技术
第43卷
(a)训练损失值
(b)训练准确率
图4训练结果图
Fig. 4 Training  results
(b)改进后测试制度
图5测试结果图
Fig. 5 Test  results
3 结语
本文将卷积神经网络应用于AUV,利用卷积神经 网络进行水下目标识别,建立一个9层的卷积神经网 络对水下拍摄的木框和三角框进行训练分类,使用卷
积神经网络提取水下目标特征,通过目标特征提取和
池化,水下目标识别在经过100次迭代训练后准确率
达到90%。之后对上述神经网络结构进行优化改进, 将1层连接层化分为3层连接,采用三段式全连接方
式,对卷积神经网络权重分别进行dropout 正则化,并
增加一层卷积层和池化层,训练经过90次迭代后基本
收敛,训练速度得到提高,在100次迭代训练后,水 下目标识别的准确率达到99.18%,同时降低了的过拟 合,提高了卷积神经网络的泛化能力。
参考文献:
[1] 钟宏伟.国外无人水下航行器装备与技术现状及展望[J].水 下无人系统学报,2017,⑷.
[2]
段世梅,康凤举,王彦恺.基于SINS/DVL/GPS 的AUV 组合 导航技术[J].火力与指挥控制,2009,34(12): 50-52.
[3] Murat  KUQUKBAYRAK, Ozhan  GUNE§, Arica  N. Underwater  Acoustic  Signal  Recognition  Methods[J]. 2009.
[4] SHIN  H  C, ROTH  H  R, GAO  M, et  al. Deep  convolutional
neural  networks  for  computer-aided  detection: CNN
architectures, dataset  characteristics  and  transfer  learning 卩].
IEEE  Transactions  on  Medical  Imaging, 2016,: 1-1.
⑸ RUSSELL  S  J, NORVIG  P, et  al. Instructor's  manual: exercise
solutions  for  artificial  intelligence  a  modern  approach]J].
Second  Edition. Artificial  Intelligence  A  Modem  Approach, 2015,15(96):217-218.
[6] HE  K, ZHANG  X, REN  S, et  al. Deep  residual  learning  for
image  recognition[C]. IEEE  Conference  on  Computer  Vision  and  Pattern  Recognition, Las  Vegas: Computer  Science, 2016:
272-275.
[7] BOUVRIE  J. Notes  on  convolutional  neural  networks, MIT
CBCL  Tech  Report, Cambridge, MA, 2006.
[8]
黄德双.神经网络模式识别系统理论[M].北京:电子工业出 版社,
1996.

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。