基于BP神经网络手写体数字识别报告
基于BP神经网络的手写体数字识别系统设计
姓名:
专业:通信与信息系统
四大名茶
学号:
一综述
1.引言
近年来人工智能技术飞快发展,数字识别技术就是其中一个非常重要的分支,它在现实生活中的应用越来越广泛。比如在大规模数据统计中的应用,在财务、税务、金融领域中的应用,在邮件分拣中的应用等。这使得手写体数字识别技术成为目前信息技术的研究热点,但同时它也是研究难点。第一,不同数字之间字形相差不大,使得准确区分某些数字相当困难;第二,数字虽然只有十种,而且笔划简单,但同一数字写法千差万别,全世界各个国家各个地区的人都用,其书写上带有明显的区域特性,很难完全做到兼顾世界各种写法的极高识别率的通用性数字识别系统。但在实际的应用中往往要求识别系统具有非常低的错误率,这使得手写体数字的识别技术的实现非常困难。
2.手写体数字识别的现状
手写体数字识别时,首先将印在纸上的数字经过光电扫描产生模拟信号,再通过模数转换变成表示灰度值的数字信号输入计算机。纸张薄厚、洁白度、书写力度和笔划质量都要造成字形的变化,产生污点、飞白、断笔、交连等干扰。因此,一般由扫描得到的数值化的字符还需要多种进一步的处理。经过国内外科学家的研究得出结果,一般在输入手写体之后,首先需对图像进行预处理,为特征提取做好准备。
特征提取一般是基于统计的特征选择方法和基于结构的特征方法进行分析。近年来,国内的一些专家学者研究出很多新型的特征提取方法,更有利于精确地识别手写体数字。
根据基于字符整体特征的快速分类方法对手写体能较灵活的进行识别。其原理是根据字符结构提取其凹凸特征。首先,出字符存在的圈,对于书写时产生的无效圈设定一定的阀值进行判别,把无效圈直接置为字符前景(像素点设为黑)。然后,出字符的凹陷区,如果图像上连接任意两点的直线都属于该图像.那么该图像为凸图像;如果连接图像上两点的直线有部分不属于该图像,那么该图像为凹图像。其中不属于图像部分所在的区域即为图像的凹陷区。最后,再将字
符的凹陷区进一步区分为左、右凹陷区。通过上述的字符处理过程,就得到了以字符有效圈、左右凹陷为判断依据的凹凸特征。
必有近忧的上一句另一种新型的特征提取方法为13点特征提取法。其总体思路是:13点特征提取方法的总体思路是:首
先把字符平均分成8份,统计每一份黑像素点的个数作为8个特征。分别统计这8个区域中的黑像素的数目,可以得到8个特征。然后统计水平方向中间两行和垂直方向中间两列的黑像素点的个数作为4个特征,最后统计所有黑像素点的个数作为第13个特征。
在特征提取之后,选择一种神经网络对手写体数字进行识别。T.F.Pawlicki 将多层BP等多种神经网络用于识别手写体数字的实验,在比较实验结果之后,证实了多层网络的分类能力要比其它几种网络好,它在一定的字符集上取得了很好的识别效果。
神经网络虽已在许多领域应用中取得了广泛的成功,但其发展还不十分成熟,还有一些问题需进一步研究和拓展。首先,神经计算的基础理论框架以及生理层面的研究仍需深入。其次,我们应该努力的拓宽神经网络领域,研究新型的网络,目前,除了传统的多层感知机、径向基函数网络、自组织特征映射网络、自适应谐振理论网络、模糊神经网络、循环神经网络之外,一些新的模型和结构很值得关注,例如最近兴起的脉冲神经网络(spiking neural network)和支持向量机(support vector machine)。而延伸到神经网络之外的技术,神经计算技术与其他技术尤其是进化计算技术的结合以及由此而来的混合方法和混合系统,正成为一大研究热点。从目前的研究不难预测,神经网络的应用领域将不断扩大,在未来的几年中有望在一些领域取得更大的成功,特别是多媒体技术、医疗、金融、电力系统等领域。
3.本课题主要内容国内音乐学院排名
通常实现手写体数字识别技术的方法有很多种,比如说Fisher线性判别方法,最小风险贝叶斯判别方法,朴素贝叶斯判别方法,神经网络方法等。这些方法都可以实现手写体数字的识别,本课题是采用后向传播(BP)神经网络算法,先用MATLAB自带的函数im2bw把输入的数字图像二值化处理,然后取得图片数字部分的最大行列和最小行列,对图片进行实际大小的裁剪,为接下来的归一化做铺垫,将图片统一成7*5大小,取得图像的矩阵特征值,输入到设置好的BP
牧草网络中,让网络学习,并保存网络,最后用sim函数仿真识别。运行程序后,训练好的神经网络对输入的数字进行识别。但是有时识别同一数字图片后所得出的结果会不相同,训练网络的时长,精确度也不相同。由此我们可以得出神经网络具有不稳定性和局限性,同时很多因素都能影响网络,比如加入噪声,所以神经网络仍需要人们进一步的研究。
二 BP神经网络
1.神经网络定义
神经网络是由多个神经元组成的广泛互连的神经网络, 能够模拟生物神经系统真实世界及物体之间所做出的交互反应. 人工神经网络处理信息是通过信息样本对神经网络的训练, 使其具有人的大脑的记忆, 辨识能力, 完成名种信息处理功能. 它不需要任何先验公式, 就能从已有数据中自动地归纳规则, 获得这些数据的内在规律, 具有良好的自学习, 自适应, 联想记忆, 并行处理和非线性形转换的能力, 特别适合
于因果关系复杂的非确定性推理, 判断, 识别和分类等问题. 对于任意一组随机的, 正态的数据, 都可以利用人工神经网络算法进行统计分析, 做出拟合和预测. 基于误差反向传播(Back propagation)算法的多层前馈网络(Multiple-layer feedforward network, 简记为BP网络), 是目前应用最成功和广泛的人工神经网络。
2.BP模型基本原理
学习过程中由信号的正向传播与误差的逆向传播两个过程组成. 正向传播时, 模式作用于输入层, 经隐层处理后, 传入误差的逆向传播阶段, 将输出误差按某种子形式, 通过隐层向输入层逐层返回, 并“分摊”给各层的所有单元, 从而获得各层单元的参考误差或称误差信号, 以作为修改各单元权值的依据. 权值不断修改的过程, 也就是网络学习过程. 此过程一直进行到网络输出的误差准逐渐减少到可接受的程度或达到设定的学习次数为止. BP网络模型包括其输入输出模型, 作用函数模型, 误差计算模型和自学习模型. BP网络由输入层, 输出层以及一个或多个隐层节点互连而成的一种多层网, 这种结构使多层前馈网络可在输入和输出间建立合适的线性或非线性关系, 又不致使网络输出限制在-1和1之间.
3.BP 算法实现
BP 网络包括其输入输出模型、作用函数模型、误差计算模型和学习模型。
(1)节点输出模型
隐节点输出模型:
怎么发消息给所有人)*(j i ij j q X W f O -=∑
输出节点输出模型:
)*(k j jk k q O T f Y -=∑
f -非线形作用函数;q -神经单元阈值。
(2)作用函数模型
作用函数是反映下层输入对上层节点刺激脉冲强度的函数又称刺激函数,一
般取为(0,1)内连续取值Sigmoid 函数:
)1/(1)(x e x f -+=
(3)误差计算模型
误差计算模型是反映神经网络期望输出与计算输出之间误差大小的函数:
2*)(2/1∑-+=pi pi O t Ep
i t pi -节点的期望输出值;i O pi -节点计算输出值。
(4)自学习模型
神经网络的学习过程,即连接下层节点和上层节点之间的权重拒阵Wij 的设
定和误差修正过程。BP 网络有师学习方式-需要设定期望值和无师学习方式-只需输入模式之分。自学习模型为文科专业介绍
)(***)1(n W a O h n W ij j i ij ∆+Φ=+∆
-h 学习因子;
-Φi 输出节点i 的计算误差;-j O 输出节点j 的计算输出;-a 动量因子。
三 手写体数字识别系统设计
1.系统整体介绍及程序设计流程图
该系统使用自建样本库,应用BP 神经网络算法对样本进行训练识别。系统分

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。