基于迁移学习的机场场面目标检测与跟踪技术研究
2021.01理论算法
基于迁移学习的机场场面目标检测与跟踪技术研究
李彦冬,夏正洪
(中国民用航空飞行学院,四川广汉,618300)
摘要:本文分析了深度学习技术的基本原理,讨论了其应用与目标检测与跟踪领域的基本方式。利用实地釆集的广汉机场场面视频数据,釆用深度迁移学习的策略,研究了面向机场场面目标的检测与跟踪技术。
关键词:深度学习;迁移学习;机场场面监视;目标检测;目标跟踪
Transfer Learning Based Research on Object Detection and Tracking
for Airport Surface Surveillance
Li Yandong,Xia Zhenghong
(Civil Aviation Flight University of China,Guanghan Sichuan,618300) Abstract:A series of research findi
ngs have been achieved in the field of object detection and tracking using deep learning method in recent years.This paper provides a brief analysis about the basic principles of deep learning.Some strategies of applying the deep learning technology to object detection and tracking are discussed・Based on some collected video data from guanghan airport,the object detection and tracking method for airport surface using transfer learning strategy is investigated.
Keywords:Deep learning;Transfer learning;Airport surface surveillance;Object detection;Object tracing
o引言
机场场面监视是民航安全运行中的重要一环,一直以来都是民航关注的一个重要问题。传统的机场场面监视主要利用场监雷达和多点定位等基于电磁波的技术手段对场面目标的位置和身份进行识别。这种方式对于目标的位置信息能够较好地进行判断,然而对于目标的类型,尤其是一些非合作目标的身份,缺少鲁棒的判断能力。
从2012年开始,深度学习技术逐渐成为人工智能领域的一个研究热点皿。近年来,针对深度学习技术的研究在图像理解、语音识别、自然语言处理、围棋对弈、自动驾驶等领域都取得了超越传统方法的突破性成果⑵。深度学习技术是一种以数据驱动的机器学习方法,可以通过大量的数据对机器学习模
型进行训练,从而让模型获得对于数据模式的识别能力。然而,在很多实际的应用场景中,数据的获取比较困难,小样本环境是深度学习技术在实际应用中通常会遇到的问题,迁移学习技术是解决小样本问题的方式之一[3]»本文以深度学习技术为研究对象,在模型训练数据不足的情况下,釆用迁移学习的策略研究对于机场场面目标的视频识别与跟踪方法。实验结果表明,基于迁移学习的策略,本文中的深度学习模型对于场面中的目标具有较好的检测与识别能力。
1基于深度学习技术的目标检测
目标检测是计算机视觉领域的一个基础而重要的问题,其研究目标是从图像或视频场景中准确定位潜在物体的位置,并且对目标物体的类别进行准确的识别。传统的目标检测算法主要通过从图像中提取大量的潜在目标框,然后对各个框图内的目标进行特征提取与识别。这种识别方式的缺陷有两点:(1)通常图像目标框的数量会比较庞大,逐个处理会
影响目标检测的速度;(2)传统方法采用人工设计特征(如: LBP,SIFT等)对目标框的特征进行提取,这些特征通常具有较弱的判别和泛化性能。
深度学习是近年来兴起的一种机器学习方法,其主要特点是对于目标特征的提取不再基于人工设计特征,而是基于层层相连的深度数学模型。通过大量数据的的训练,原本参数随机初始化的深度网络能够学习到数据中潜在的特征,从而完成特征的提取。众多研究表明,这种通过学习方式获得的目标特
征相比于传统的人工设计特征具有更好的表达能力。深度学习模型作为一种数据驱动的数学模型,对数据量的要求比较高,因此,对于一些数据量相对有限的特定应用场景,通常釆用迁移学习的策略。迁移学习的思路是先通过在大型数据集上对深度学习模型进行训练,让模型的训练误差达到收敛,确定模型中的参数值,然后通过针对特定小样本数据集的训练,对模型参数进行微调更新,从而让模型对于小样本数据集具有特征提取与判别的能力。通过迁移学习策略,解决了小样本数据集对于深度模型的训练支持不足的问题,有效地扩展了深度学习技术在特定场景的应用。
2基于迁移学习的场面目标检测
针对机场场面视频数据集相对环境比较单一,训练样本
基金项目:四川省重点研发计划(2019YFG0308);中国民航飞行学院面上项目(J2020-080,J2020-078)。
甲耳测说里ELECTRONIC TEST
较少的特点,本文利用基于迁移学习的场面目标检测模型训
练方案进行面向场面目标的检测模型训练(如图1所示)。该方案主要分为:构建深度学习模型、构建训练数据集和模型
训练三个主要部分。
2.1构建深度学习模型
目标检测的深度学习模型主要分为精度较高的两阶段模型和速度较快的一阶段模型两个大类。针对场面目标检测的实时性需求,本文选择了一阶段代表性的YOLO模型作为目标检测模型进行研究。YOLO是一种端到端的目标检测模型,针对原始图像通过骨干卷积网络提取特征,然后通过设计的Neck结构对于特征在多尺度上进行融合,最终在输出层通过非最大抑制(Non-Maximum Suppresion,NMS)的策略进行检测框的生成。YOLO模型具有轻量级,运行速度快的特点,在通用数据集的测试上也具有一定的目标识别准确度。
2.2训练数据集
图2广汉机场视频图像人工标注(4:飞机,0:行人)
在训练数据集方面,本文釆用了通用的目标检测数据集
MSCOCO和实地采集的广汉机场视频图像数据集。
MSCOCO数据集在目标检测领域是一个应用广泛的数据
集,其包含了91个目标类别,超过10万张用于训练和测试的图片,对于大型深度网络来说是一个常用的数据集。但是,由于机场场面的运行具有其具体特点,因此针对机场实地采集数据,也进行了相应的目标标注用于训练。图2是人工标注的一个样本图像。其中,行人以标签0作为标记,飞机以标签4作为标记。
2.3训练模型
在实际的模型训练中,针对输入图像X,首先通过目标检测模型完成网络的前向传导:
H=/(W®X+b)(1)
公式(1)中,f(x)是基于网络模型参数(W,b)的目标检测模型。模型初始化参数随机,通过前向传导之后,获得潜在
的目标检测结果H=岛,目标检测结果与数据集标签Hi'之间的差异,作为训练的损失E(W,b):
E(W,b)=£弊黑⑵
对于损失E(W,b),通过梯度下降方法(Stochastic Gradient Descent,SGD)对网络参数(W,B)进行更新:
(3)
(4)
经过训练后的网络f(W,b)通过更新网络的参数,能够拟合训练数据集的特点,从而具备目标检测的能力。
本文中釆用的MSCOCO数据集尺度比较大,具有良好的模型参数训练功能,但是不具备针对特定场景的目标检测标
记。因此,在实际训练过程中,先使用MSCOCO数据集对参数训练到收敛,然后使用人工标注的广汉机场数据集进行迁移训练,从而使模型具有良好的对于机场场面目标的检测与跟踪能力。
3实验分析
本文使用的深度学习硬件平台主要包括Xeon(R)W-2133处理器(3.6GHz),64GB内存和RTX2080Ti显卡。实验软件环境采用64位Ubuntu1&04操作系统。实验结果表明(表1),经过迁移学习的深度目标检测模型能够在广汉机场对飞机、车辆和人物目标的识别准确率达到82%,跟踪准确率达到78%。在图像处理速度方面,由于深度网络的运算开销较大,采用CPU的处理速度较慢,约为3帧/秒。但是,在采用GPU 处理之后,图像处理的速度能够达到约45帧/秒,可以满足实时的场面目标检测与跟踪需求。
表1广汉机场场面目标检测模型实验结果
场面目标检场面目标跟GPU处理速CPU处理速
测准确率踪准确率度FPS度FPS
基于深度迁移学
习的广汉机场场
上班路上算工伤吗
面目标检测模型
82%78%453
图3同一帧视频在迁移学习前(左)与迁移学习后(右)的目标
检测效果对比
图3是三帧视频在迁移学习前后的目标检测效果对比。从图中可以发现,仅仅通过在大型数据集MSCOCO上训练得到的目标检测模型并不能够很好地应用于机场场面环境的目标检测工作中,出现了较多的飞机漏检、将VOR导航台错判为飞机等目标检测错误。在迁移学习后,模型对于机场场面的
(下转第66页)
申耳测ii!
52
[3]Rogers T,Aitken N,Stribley K,et al.Improvements in
MEMS Gyroscope Production as a Result of Using in
Situ,Aligned,Current-limited Anodic Bonding[J].IEEE
Sensors and Actuators,2005,Pages:106-110.[J]
⑷Judy M W.Evolution of Integrated Inertial MEMS
Technology[C]//Solid一State Sensor,Actuator
and Microsystems Workshop Digest0-9640024-
5-0.Hilton Head Island,South Carolina,USA,
2004,Pages:27-32.[R]
[5]Teodor Lucian Grigorie,The Matlab/Simulink
Modeling and Numerical Simulation of an Analogue
Capacitive Micro-Accelerometer.Part1:open loop, MEMSTECH,2008,May21-24,200&Polyana,
UKRAINE,Pages:105-114.[C]
[6]Dzhandzhgava G I,Bakhonin K A,Vinogradov G M,
et al.Strapdown inertial navigation system based
on a hemispherical resonance gyro.Gyroscopy and
Navigation,2010,1⑵:91-97.[J]
[7]Moussa H,Bourquin R.Theory of Direct Frequency
Output Vibrating Gyroscopes.IEEE Sensors Journal,
2006,Pages:310-315.[J]
[8]He C,Zhao Q,Yan G.Closed loop control design for the
sense mode of micromachined vibratory gyroscopes.
(上接第52页)
飞机、行人和汽车都能够进行较为准确的识别。因此,迁移学习在深度目标检测模型应用于具体场景中的时候具有非常关键的作用。
4结束语怎么设置充电提示音
本文针对基于迁移学习的机场场面目标检测与跟踪技术进行了研究。采用迁移学习的策略,使基于大型通用目标检测数据集训练的目标检测模型具有了针对特定机场场面目标的检测与跟踪能力。基于广汉机场实地采集的视频图像分析,该方法具有较好的场面目标检测与跟踪性能,并且在GPU计算的条件下,能够具备实时图像处理的能力。
参考文献
[1]A.Krizhevsky,I.Sutskever,G.E.Hinton.ImageNet
classification with deep convolutional neural
networks[C]//Proceedings of Advances in
Science China,2013,Pages:1112-1118.[J]
[9] Franpois P e cheux,Christophe Lallement,Alain
Vachoux.VHDL-AMS and Verilog-AMS as Alternative Hardware Description Languages for Efficient Modeling of Multidiscipline Systems.IEEE TRANSACTIONS ON COMPUTER-AIDED DESIGN OF INTEGRATED CIRCUITS AND SYSTEMS,VOL24, NO.2,FEBRUARY2005,[J]
双系统启动设置[10]Chandradip Patel and Patrick McCluskey."Modeling
and Simulation of the MEMS Vibratory Gyroscope".
13th IEEE ITHERM Conference.[C]
[11]Xianglei Wei,Chunhua He,Qiancheng Zhao,小学高级教师述职报告
Zhenchuan Yang,and Guizhen Yan.Research on the Ring-Diode Based Readout Circuit for MEMS Vibratory Gyroscopes.Proceedings of the12th IEEE International Conference on Nano/Micro Engineered and Molecular SystemsApril9-12,2017,Los Angeles,USA.[C]
作者简介
范艺晖(1993-),男,博士研究生,中科院微电子所智能感知中心,研究方向:CMOS模拟前端电路设计。
水煮肉片具体做法Neural Information Processing Systems,Lake Tahoe.2012,1106-1114.
[2]Y.Lecun.Y.Bengio,G.E.Hinton.Deep learning[J].
Nature,2015,521:436-444.
⑶庄福振,罗平,何清,等.迁移学习研究进展[J].软件学
报,2015,26⑴:26・39*
[4]Ren S.,He K.,Girshick R.,Sun J.(2017)Faster
RCNN:Towards real time object detection with region proposal networks.IEEE TPAMI.2017,39⑹:1137-1149.
[5]Lin T.,Maire M.,Belongie S.,Hays J.,Perona P.,Ramanan
D.,Doir ar P.,Zitnick L.Microsoft COCO:Common
objects in context[C]//In:ECCV,2014,pp.740-755.
[6]Redmon J.,Divvala S.,Girshick R.,Farhadi A.You only
look once:Unified,real time object detection[C]// In:CVPR,2016,pp.779-788.
(上接第77页)
[6]Carles,Gomez,Joaquim,et al.Overview and Evaluation
of Bluetooth Low Energy:An Emerging Low-Power Wireless Technology[J].Sensors,2012.
[7]Kevin Townsend,Carles Cuf i,Akiba,et al.Getting
羽毛球场地尺寸Started with Bluetooth Low Energy[J],oreilly media, 2014.⑻Mackensen E,Lai M,Wendt T M.Bluetooth Low
Energy(BLE)based wireless sensors[C]//Sensors, IEEE.IEEE,2012.
[9]Levy,Amit A.Hong,James,Riliskis,Laurynas,et
al.Beetle:Flexible Communication for Bluetooth Low Energy.[J].2O16.
ELECTRONIC
TEST

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。