基于卷积神经网络的宠物猫品种分类研究
作者:王建霞 张成 闫双双
来源:《河北工业科技》2020年第06期
摘 要: 为了提高宠物猫品种分类的准确率,提出了一种卷积神经网络融合的方法进行特征提取。首先,基于堆叠卷积自动编码器的域自适应技术,采用反卷积操作丰富特征图;其次,利用Inception结构增加网络的宽度来提取多尺度信息的特征图;最后,使用Softmox函数对图像进行分类,在Oxford-ⅢT数据集中进行实验分析。实验结果表明,利用改进后的模型对宠物猫进行分类,准确率高于对比模型,达到了84.56%,损失值为0.015 0。所提出的卷积神经网络融合方法不仅能通过丰富特征图、加深网络深度更好地表达特征,还能提高分类性能和收敛性能,较好地解决了宠物品种识别中由宠物相似所带来的识别率低的问题,还可以推广应用到其他图像相似问题的应用场景中。
关键词: 计算机图像处理;深度学习;卷积神经网络;反卷积;宠物猫分类
中图分类号: TP319 文献标识码: A
doi: 10.7535/hbgykj.2020yx06004
Research on pet cat breed classification based on
convolutional neural network
WANG Jianxia, ZHANG Cheng, YAN Shuangshuang
(College of Information Science and Engineering, Hebei University of Science and Technology, Shijiazhuang, Hebei 050018, China)
保护环境的宣传语 Abstract:
In order to improve the accuracy of pet cat breed classification, a convolutional neural network fusion method was proposed for feature extraction. Firstly, based on the domain adaptive technology of the stacked convolutional autoencoder, the deconvolution operation was used to enrich the feature map; Secondly, the Inception structure was used to increase the width of the network to extract the feature map of multi-scale information; Finally, the images were classified by the Softmox function and were experimentally analyzed in the Oxford-ⅢT data set. The experimental results show that the accuracy of classifying pet cats by using the improved model is higher than that of the comparison model, reaching 84.56%, and the loss value is 0.015 0 . The proposed convolutional neural network fusion method can not only enrich feature maps a
有网络但无法连接app storend deepen the network depth to better express features, but also improve the classification performance and convergence performance. The method can better solve the problem of low recognition rate caused by pet similarity in pet breed recognition, and can also be extended to the application scenarios of other image similarity problems.
Keywords:
computer image processing; deep learning; convolutional neural network; deconvolution; pet cat classification
宠物是人们为了消除孤寂或者出于娱乐而饲养的动物,有些工具型宠物还能够帮助人们。但是每个宠物的品种又有许多种,不同品种宠物的毛、性格等各不相同,人们在选择某一个宠物时,品种会是考虑的首要因素,但宠物品种的识别并不像人们想象的那样简单。不同品种的宠物有的会很相似,而同种宠物看上去却相差甚远,这种情况对宠物专家来说也是一种考验,虽然可以选择DNA鉴定方法对宠物的品种进行识别,但是比较耗费时间和金钱。ZHANG等 [1] 提出利用纹理和形状特征训练级联分类器,可以对静态类猫图像进行识别; PRASONG在2012年提出利用犬类图片的局部大小和位置进行粗分类和基于PC
A的分类器进行精细分类;WANG等 [2] 在2014年提出了利用基于地标形状的犬种分类方法;SINNOTT等 [3] 在2018年使用传统的神经网络算法进行图像分类等。虽然这些方法相較于传统方法提高了识别效率,但都需要人工设计特征,而人工设计特征往往缺乏良好的泛化性能,且依赖于设计者的先验知识和对分类任务的理解,导致训练好的模型具有局限性。
qq个性签名男生超拽 随着物联网 [4] 和人工智能 [5] 的快速發展,科学家们开始利用卷积神经网络来提取特征。它是直接对输入的原始图像进行处理,在神经网络的内部就能得到有代表性的良好特征,解决了传统方法中人工提取特征的繁琐问题和主观性问题。例如:AlexNet [6] ,VGGNet [7] ,GoogleNet [8-12] 等,这些卷积神经网络都是在加深网络的同时又提高了性能,利用批归一化 [13] 和Dropout [14] 避免过拟合和退化。采取卷积神经网络特征提取方法,不仅能够提升分类器的效能,还能够削减对图像分类算法的依赖程度。
本文针对多个品种猫的图像数据集进行了品种分类,且由于猫的数据集比较少,需在猫的数据集上进行数据增强,因此,通过数据增强方法将猫的数据集增强到了14 000张。对增强后的数据集采用一种反卷积的网络结构将特征图进行大小转换,得到多个尺度的特
征图,然后融合不同尺度卷积核的 Inception 模块。采用这样的结合方式不仅能够增强后续卷积运算的特征信息,还能丰富网络的表达能力,提高对图像的分类准确率。
1 相关理论研究
深度学习 [15] 起源于人工神经网络,是有多个隐含层的网络结构,与传统机器学习相比,它不需要人工提取特征,而是将数据输入网络中自动生成学习特征。在解决图像分类问题上通常利用深度学习中的卷积神经网络模型CNN对二维图像进行卷积运算处理获得特征,然后增加卷积神经网络的层数,增多卷积神经网络每一层的节点数量,以此提高模型的性能 [16] 。为了解决时间消耗和计算资源的问题,又引入了迁移学习。迁移学习是一种能够将预训练的模型进行重新训练后,再应用到其他任务中进行学习的方式,常用的迁移学习有VGG16, Inception-V3 等。
星期日的英文 1.1 VGGNet模型
VGGNet网络结构是将CNN中的卷积核由 5×5 尺寸改为用2个3×3的卷积进行替代,然后对3×3的卷积核和2×2的最大池化层反复叠成 16—19 层,这样能大幅度地降低训练时
的参数数量,同时也能将原有的卷积运算通过增加网络的层数来提升网络模型的性能。VGGNet-16分为5段,每段的组成都是2—3层卷积再加上池化层,每段的卷积核数量分别是64—128—256—512—512,但是每段中每层的卷积数量是一样的。网络模型最后的部分是由3个全连接层和1个softmax层组成。在对图像进行分类时常用VGGNet提取图像特征。VGGNet-16网络结构如图1所示。
1.2 Inception-V3
由于在VGGNet中增加网络深度会增加参数的数量,进而增加计算的复杂度,Google公司为了解决这个问题提出了一个由11个Inception模块(如图2所示)串联组成Inception-V3网络模型,相比于VGGNet有更深的网络,深度可达到46层,但是网络参数减少了,计算效率非常高。
每当我走过老师窗前歌词 1.3 改进模型理论
针对猫品种的数据集较少且特征不明显,采用人工和普通卷积神经网络提取特征的方式在进行模型训练精准度不高的问题,本文对猫品种分类的特征提取部分进行了改进。对离婚过错方少分或不分财产
猫的品种进行分类训练模型的网络结构如图3所示,其分为改进模块、 Inception 模块、全连接层和输出层,改进模块网络结构图如图4所示。
在进行卷积运算时,当特征图比较大时,所包含的图像细节较多,但是高层次表现出来的特征信息比较少;当特征图比较小时,具有更好的高层次语义信息,但分辨率比较差 [17] 。因此,本文选择将两者结合起来,既能包含较多的图像细节,也能获得尽可能强的图像语义信息 [18] 。而且在使用多个层次的特征进行联合检测时,尺度较小的目标也能被有效地检测到 [19] ,利用反卷积的结构就能将特征图进行大小转换,得到多个尺度的特征图信息,再使用不同尺度的特征进行关键点检测。前后的模块会将特征信息充分利用,进而获取更为丰富的特征图。把尺度大小相同的特征图传入Inception模块中,如图2所示。Inception模块由4个分支构成,每个分支中 1×1 的卷积运算来源于Network In Network [20] 中的思路。
第1个分支只对数据进行1×1的卷积运算;第2个分支是先 1×1 卷积之后再进行3×3卷积运算;第3个分支是先1×1卷积之后再进行5×5卷积运算;第4个分支是先3×3池化再进行1×1卷积运算。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论