基于卷积神经网络的场景分类预测模型应用
2021.5
1概述
人工智能机器人、无人驾驶已普遍应用在多个科技
领域,而场景的分类对于人工智能机器人、无人驾驶技术来说,尤为重要。机器人都过辨别所处的场景,做出相应的应答措施;无人驾驶汽车通过场景的识别和分类来辨别自己行驶车道的精准度,所以场景分类给予人工智能机器人、无人驾驶等技术提供了重要的支撑。而且其中实现的Python 语言在Linux 平台具有更强的鲁棒性和易移植性等多种优点,为更多的机器学习提供优良的理论和实战根基。
目前常用的场景分类方法主要有,依靠传统人工设计的局部特征描述子,其中视觉词标签提出要把像素点局部不变的特征作为标签,提取出来,然后再通过视觉词标签出现的频率塑造整个图像[1-2]。该方法虽然能够进行场景分类,但是该模型忽视了视觉标签的位置地址
信息,要实现图像之间的相互关系实乃遥不可及,所以针对大部分图像场景分类方法中提取的特征结构
单一,依赖于大量人工标记的数据以及分类器的训练过程缓慢等问题,提出了用卷积神经网络的场景分类模型参与预测,测试实验结果表明了其超高的准确度。
2
关键技术
2.1Tensorflow
Tensorflow [3]是一个基于数据流编程的符号数学系统,
被广泛应用于各类机器学习算法的编程实现,其前身是谷歌的神经网络算法库DislBelief [4],Tensorflow 给予
Python 4个不同版本,而且安装Python 版的Tensorflow 可以使用模块管理工具pip/pip3在终端直接运行,主要应用Tensorflow 库里面的深度学习框架,对场景特征进行深度学习和特征提取。
2.2卷积神经网络
卷积神经网络[5]是当代神经网络的核心框架的延申,
Tensorflow 又为卷积神经网络的实现提供了及其重要的
基本工具,提供了重要的算法库,从搭建环境到里面理论的深度研究、内核代码的实践,给本文场景分类模型的建立提供了极其重要的作用,使用Python 实现了卷积神经网络3层结构,卷积层、采样层和全链接层,单个神经元经过每一层的加权和偏移,再经过激活函数,循环训练成百上千次,获得各类场景对应的标签文件,Python 实验显示精准度达到百分之九十以上。2.3重要平台和工具
主要用到平台和工具有Jupyter,Python,Apache,
Plotly。Jupyter:Jupyter 是一个交互式笔记本,支持40多种编程语言,文中的模型和标签建立好之后,使用Jupyter 作最后的预测结果分析,目的是其精细的数据分析结果展示、分享便捷、交互式展现等诸多优点,而且直接用pip install jupyter notebook 安装即可。Python:Python 是主要编译软件,其强大的简洁性深受大众的喜爱,同样的功能在C 语言,Java 语言需要大量代码是实现,可是用Python 实现可能就只需要一句代码或者几句代码。Apache:用到Apache 主要是考虑到平台的可移植性,让代码即使在Linux 中也能够很好地使用。Plotly:是Python 的重要的画图工具包,只需要一句代码import plotly as py 就可以引入画图包,接下来就可以基金项目:2020年度广东省普通高校科研平台项目”人工智能技术应用创新团队”,项目编号2020KCXTD045。作者简介:涂蓝(1986-),男,硕士,研究方向:RFID 技术、人工智能技术、图像处理。
基于卷积神经网络的场景分类预测模型应用
涂蓝
(汕尾职业技术学院信息工程学院,广东汕尾516600)
要:传统的场景分类技术对场景数据的采集、特征提取和预测模型复杂,且识别度及识别结果不高,卷积神经网络技术的优化升级,给场景分类模型提供了坚实的基础,为了提高场景图像特有的特征属性和场景分类的可辨别性,提出了卷积神经网络(CNN )的场景分类模型。此模型建构方法:(1)应用卷积神经网络的机器学习算法和递归神经网络,分别对数据库中的10种场景(每种场景有上百幅图片)做加权和特征提取;(2)用Python 语言编程对训练的场景进行模型的建立;(3)用百幅图片数据集之外的10个图片投入模型中,读取结果,测试结果表明,这10个新的数据集能够被模型识别出相应的场景,并且准确度达到百分之九十六以上。关键词:卷积神经网络;场景分类;教学应用;Python 语言
142
2021.5
使用库里面的工具画出各种可视化的图形,对数据可视化提供了很大的帮助。
3
场景分类模型实现思路
3.1数据集的选取与图像的预处理
采用汕尾职业技术学院人工智能技术团队的X7GW
航拍GPS 无人机4K 双摄像头GPS 定位自动返航4轴飞行器遥控飞机(WHU-X7GW)拍摄的10类土地场景,每个场景含有700张图像,总共7000张图片,图片的像素大小为800*533,空间分辨率为3米;无人机所拍数据集涵盖10类土地场景,每个场景覆盖700张图片左右,每个场景的具体数据如表1所示,总共7000张图片,每个图片的像素大小为800×533。
由于卷积神经网络预先处理的图像像素的大小必须是标准化的,因此采集到的图片数据在图像经历神经网络之前,需要作相应的图像化处理,必须统一图片的像素度,对于神经网络输入像素大小为;225×225。采用缩小的方式对图像预先进行了处理,使其拥有共同的输入图像化标准,如图1中的每个图片一一对应10个场景的图片,图2为7000张图片之外所要预测的新图片,保证新图片在7000张原始数据中从未出现过,这样才能够测试检测出整个预测模型的准确性。
场景图像数据集的预处理,是整个模型建立的重要环节,需要先分别单独对每个图像进行预处理,对输入的图像进行特征提取、分割和匹配,作相应的一系列处理,总共循环执行700次,因为每种场景有700张图像。图像的预处理可以有效地去除图像里面的无用信息,强调有用的真实信息,增加重要信息的检测度和最
大限度约简数据,从而改进特征提取、图像分割、匹配和识别的鲁棒性。
3.2建立场景分类模型
Tensorflow 实现应用场景的分类主要采用SVM
(Support Vector Machines)[1],模型训练200个批次,根据实际需要,可以训练更多个批次,得出场景分类模型和场景所对应的标签。训练前引入的库:
import matplotlib as mpl //在Python 画图的;import matplotlib.pyplot as plt //上面的一个子类;
%matplotlib inline //有这条命令才可以在notebook //画图;
import numpy as np;import sklearn;
import pandas as pd //处理数据的库;import os;import sys;import time;import tensorflow as tf;
from tensorflow import keras 3.3实验结果及分析
10个新图像数据集在已经训练好的模型中,全部
预测出来了,并且一一对应了其真实的应用场景。结果如图3所示,通过评估模型系统的场景分类模型之后,生活中的任意场景图像都可以在此模型中得到相应的应用,而且其准确度达到了百分之九十以上,可以为机器
学习提供良好的实战支撑。
Types
Images Type
Images 0航站楼7005舞台7001停机坪7006艺术室7002机舱7007流水线7003游乐场7008棒球场
700
4冰场700
9橄榄球场
700
1无人机拍摄的数据集样本情况
(0)航站楼(1)停机坪(2)机舱(3)游乐场(4)冰场
(5)舞台(6)艺术室(7)流水线(8)冰场(9)橄榄球场
图1训练样本
棒球场
冰场
橄榄球场
航站楼
机舱
流水线停机坪舞台艺术室游乐场
图2预测样本
图3
143
2021.5
Ray ray =Camera.main.ViewportPointToRay
(new Vector3(0.5f,0.5f,0));
RaycastHit hit;
if (Physics.Raycast(ray,out hit)){
怎样添加空间背景音乐Startfz(hit);}
else {
RingTurn.instance.ring.fillAmount =0;}}
void Startfz(RaycastHit hit){
if (llider.name =="fengzheng1"){
RingTurn.instance.ring.fillAmount +=Time.deltaTime;
if (RingTurn.instance.isTrigger){
SetActive(true);
RingTurn.ansform.local⁃
Position =Vector3.MoveTowards (RingTurn.ansform.localPosition,new Vector3(330,64,190),Time.deltaTime);
}}}4.2.5风筝语音
在整个场景中,需要添加背景音乐,来实现音乐效果。方法如下:
创建或选中合适的物体后,添加AudioSource 组件,然后设置其Audio Clip、Play on Awake、Loop 等属性,
即可播放背景音乐。
另外,在场景中漫游时,可以通过碰撞触发音效的方式播放不同类型的风筝语音介绍。主要代码如下:public AudioClip AC;
public void OnCollisionEnter(Collision collision){
transform.localPosition =new Vector3(255,80,76);
AudioSource.PlayClipAtPoint (AC,transform.lo⁃
calPosition);
}
5结语
通过动静结合的方式来介绍风筝的历史演化发展过
程,同时伴有语音讲解相关人物的故事,让枯燥无趣的文字动起来,在了解风筝文化的同时,领略到风格迥异的风筝。实现潍坊风筝的“活态传承”,将风筝新颖的内容、鲜明的视觉表现、身临其境的体验、良好的交互等有机结合起来,使风筝的各种表现活灵活现,提高人们对传统手工艺的保护意识,有效地对潍坊风筝文化和技艺进行保护和传承,为传统手工艺品的保护和传播提供广阔的空间。
参考文献
[1]张永.VR 技术在贵州非遗工艺品傩面具传承发展中的应用[J].轻纺工业与技术,2020,(11):31.
[2]郭磊.基于虚拟现实技术的场景交互漫游应用研究
[J].电脑编程技巧与维护,2017,(10):86-87.4结语
Internet、5G、机器学习、深度学习、神经网络等高精尖的技术超速发展,给予了Python 从前端到后台,从数据端再到可视化,都提供了及其重要的平台和支撑。而且Python 语言在Jupyter 编译平台软件上,更容易实现和验证实验效果的精准度,再加上各种第三方库的加入,让大数据、数据挖掘、人工智能,有了更宽广的施展空间。场景分类模型,在各种平台资源的优势下,从数据的选材,数据的预处理,数据的读取特征,数据的读取标签,到数据的建模及其数据预测的可视化对作者研究场景分类模型提供了强大有力的理论基础和技能基础。最后的测试实验数据也验证了,在700多张图片中所建立的场景分类模型,能够很好地预测新出现的场景,也证明了卷积神经网络的场景分类预测模型具有较高的鲁棒性。参考文献
[1]Yang W ,Yin X ,Xia G S .Learning High-level Fea⁃
tures for Satellite Image Classification With Limited Labeled Samples [J].IEEE Transactions on Geoence and Remote Sensing,2015,53(8):4472-4482.
[2]Shao,Yang,Xia.Extreme value theory-based calibra⁃
tion for the fusion of multiple features in high-resolu tion satellite scene classification [J].International Jour⁃nal of Remote Sensing,2013,34(23):8588-8602.
[3]章敏敏,徐和平,王晓洁,周梦昀,洪淑月.谷歌
TensorFlow 机器学习框架及应用[J].微型机与应用,2017,36(10):58-60.
[4]尚世锋,曹洁,张增.基于CNN 神经网络的人脸识
别模型研究[J/OL].现代信息科技,[2021-01-15].
(上接第127页)
144

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。