Vol. 47,No. 1Feb. 2019
第47卷第1期2019年2月
气象科技
METEOROLOGIC A L SCIENCE AND TECHNOLOGY
基于雨声识别的雨量测量方法
丁苑⑺行鸿彦II
(1南京岱息T.程大学,气象灾害预报预警'J 评估协同创新中心•南京210044;
2南京信息丁程大学,江苏省气象探测与信息处理重点实验室.南京21004-1)
摘要针对传统雨量测量耗时氏•维护不方便的问题.本文在分析声信号识別技术的基础1:,提出了基于雨声识別
的雨量测量方法•模拟人耳听觉中对频域划定的非线性性利对同一频率样声信号作叠加评价的机理•将傅叫叶变
换后的能量谱通过梅尔(Mel)滤波器,提取雨声的梅尔频率倒谱系数(MFCC)作为雨声信号的特征向輦。在此基 础上.构建一个•:层BP 神经网络.将归一化后的样本数据用于神经网络训练.最后将测试样本用于对雨量的识別。
试验结果表明.在少量样木训练的基础上神经网络即能有效识別雨量大小•为声信号识别技术应用于更为精准的 雨量测量提供了理论依据。
关键词雨声信号;特征提取;BP 神经网络;雨肚识別
中图分类号:P 』26. 6;TN912. 34 DOI : 10. 19517/j. 1671-6345. 20180091 文献标识码:A
引言
降水是气象观测的关键要素之一':,是水资源
利用的重要组成部分。降雨信息是研究气候变迁、 环境监测、水库管理等方面的重要依据灯。因此.降
雨量和降雨强度的准确检测•对生产实践具有重要 意义I 。在传统的雨量测量方法中,主要依赖于
对雨水的直接收集.按照中国气象局对降雨量等级 的划分,24 h,降雨量在0. 1~9. 9 mm 之间为小雨;
降雨量在10 ~ 24. 9 mm 之间为中雨;降雨量在
25. 0~49. 9 mm 之间为大雨。随着信息智能化的
发展.各类模式识别技术日益得到关注,声信号识別
是利用目标在介质中运动时所产生的声音信号,进
行特征向量提取并设计分类器以实现对目标的识 别®。由于声音信号的获取十分便捷,广泛应用于
各类信号识别中。将声音识别技术应用于气象领
域.应用于对降雨强度的判断•符合未来降雨测量的 发展趋势.有较好的应用前景。
国外早在20世纪60年代就开始研究降水的自
动化测量方法.其基本保证有两个方面,一是仪器的 精密度,二是算法的精确性。随着现代数字处理技
术的发展.国外陆续出现了基于振动法、光学法、摄
像法的降水测量方式并逐步成熟.但各种方法的技 术水平各有限制•新型有效的雨量测量方法仍是众
多学者关注的问题。
随着降雨强度的变化•人耳所能听到的雨声发
生明显变化•从而判断雨量大小。人工神经网络
(Artificial Neural Network . ANN )是一种模仿动物
神经网络行为特征.进行分布式并行信息处理的算
法数学模型。人工神经网络和各种其他汁算技术可 用于处理大数据以判断信号类别*
*。基于神经网络 理论,结合现代数字信号处理手段.研究新型雨量检 测方法,对提高现有雨量检测水平具有重大意义。
国内学者金龙'等人在1997年率先将神经网络用
于讯期降水预报性能与逐步冋归预报准确率的对比 分析中去。随后.白慧卿等人研究了卫星云图云系识
别的人工神经网络方法⑷,在将该方法与传统基于统
计的卫星云图云系识别方法进行对比时发现.神经网 络方法在识別时准确率更高。因而将神经网络移植
于对雨声信号的训练识别中是十分高效的方法。
htlp : / www. qxkj. net. cn 气象科技
国家自然科学基金(61671248. 41605121)、江苏省重点研发计划项目(BE2018719)和江苏省“信息与通信丁程”优势学科计划资助
作者简介:丁苑•女.1995年生•硕士生,主要研究方向为微弱信号检测与处理、声信号处理,Email : 1415593385®qq. com
收稿日期:2018年2月9日;定稿H 期:2018年10月23 H
* 通信作者• Email : xinghy@nuist. edu. cn
36气象科技第47卷
本文通过对不同降雨强度的雨声信号进行频谱
分析并做相关预处理,提取其梅尔频率倒谱系数
(Mel-Frequency Cepstral Coefficients,MFCC)作为
特征向量,成功训练出一个BP神经网络,用于对雨
量进行识别。从而提供一种全新的雨量大小的测量
方法,拓宽了降水测量的手段。
1雨声信号分析与预处理
1.1雨声信号的釆集与分析
雨声主要是指雨水下落时,与地面、窗户等物体
在重力的作用下发生撞击所产生的敲击声,简称雨声。由于受雨水撞击面的材质不同,使得引起振动时的振动频率及幅度不同,就形成了不同的雨声。本文的主要研究目标是在同样的声场背景下通过雨声对大雨、中雨、小雨这3类雨量进行区分,由此验证基于雨声识别的雨量测量方法的可行性。雨伞伞面紧绷、轻薄,雨水落至伞面时敲击声清晰易获取,在雨天录制雨声时.使用同一把雨伞,将声音传感器放置于伞柄靠近伞面,约0.15m处进行雨声录制,每段音频录制持续30〜50s以保持录制的稳定性,保存为WV无损格式。最后通过比对中央气象台发布的降水量信息为音频文件标注雨量类别。使用录制好的音频文件做分析时,利用MATLAB软件中的au-dioreadO函数读取音频数据作为本文的处理对象。
由3类雨声信号的波形(图1〜3)可看出,大雨、中雨、小雨这3类雨声信号频率高低有显著区别,且属于非平稳随机信号。因而一般信号处理手段无法直接处理雨声信号,须在频谱特征提取前作相关雨声信号预处理。
图1大雨声信号波形
采样点*敦
图2中雨声信号波形
图3小雨声信号波形
1.2雨声信号预处理
对于非平稳的雨声信号,须经过的预处理主要有预加重、加窗分帧和端点检测。
(1)预加重。主要对雨声信号的高频部分进行加重,去除或减少尖锐噪声影响,提升高频成分凹。在预加重过程中,选用H(z)=1—0.98药|一阶高通数字滤波器加重雨声信号的高频成分,补偿该部分信号分量的损失。
(2)加窗分帧。为将雨声信号转变为有限长序列供计算机处理,采用分帧与加窗的短时分析技术。对于非平稳的雨声信号,在短时间(通常在10〜30 ms内)可以被认为是近似不变的,即声音信号具有短时平稳性少〕。分帧采用可移动的有限长度窗口进行加权来实现。一般每秒的帧数约33〜100帧,为了使两帧之间的参数能较平稳地过渡,帧与帧之间的偏移通常取帧长的1/2或1/3,如图4所示。因此,将雨声信号分256点为一帧,帧移80
。
第1期丁苑等:基于雨声识别的雨量测量方法37帧长
第k帧
帧移
帧长
k————$
第上+1帧
图4声信号分帧
对信号的加窗可避免信号的边缘影响,减少泄
露。汉明窗主瓣宽度较宽,旁瓣衰减较大,具有更平滑
的低通特性,能够在较高程度上反映短时信号的频率
特性,我们采用汉明窗作为雨声信号处理的窗函数。
0.54-0.46^(^) 00w"W N—1其他
9(7?)=
(1)式中:N为窗口长度。
(3)端点检测。即从一段信号中确定声咅的起始点和结束点,是为在复杂应用环境下.从信号流中分辨出声音信号和非声音信号,由于雨声信号的产生因天气状况有阶段性,因此端点检测十分必要。常用方法为双门限检测法。
2特征提取
完成雨量识别的一个关键步骤是对雨声信号进行特征提取。首先将相关样本选中并同化.接下来对选定类型进行特征提取.这对于识别效果至关重要「⑴。特征提取的目的是在大量的原始数据中求出最有效的目标特征数据•降低数据维度.便于进行识别:⑵。由于Mel频率尺度比较接近人耳的实际听觉情况.模拟人耳听觉中主观感知对频域划定的非线性性及对同一频率声信号作叠加评价的机理,因此Mel频率倒谱系数常常作为声信号特性的特征参数⑷,其提取过程如下:
(1)首先将经预处理后的雨声信号进行快速傅里叶变换.对其频谱求平方得到能量谱。采用1组Mel滤波器对能量谱进行带通滤波閃,得到滤波器输出的一组系数
M=ln[X4)X H”d)](2)其中•H”(6)是滤波器的频响函数.其表达式如下:0&V/S—1),怡〉/(加+1) ...“气八旷二、心―DUS)
(3)式中:/(,")为其中心频率。
(2)对输出量取对数,得到对应频带内的对数功率谱,并进行反离散余弦变化,得到i个MFCC参数。通常选择前12〜16维作为特征参数.在此选取12维。MFCC系数求解公式如下:
C”=另lgy'(")cos[x(”—丁)m/N](4)”=1
式中:m=1,2,3,---,/,设第”个滤波器的功率谱为y'(“)。
由此获得MFCC系数,称为此雨声信号的静态特征。经此过程求取到3类雨声信号的MFCC系数.取i=12,分别得到一个10X12的系数矩阵。随后,为了便于对后期分类器的设计,需要降低数据维度。设MFCC系数矩阵中的每一维向量为“::
La,-,c,,d,,e t.fi,gi,h,,i/.J/]7,/=1,2,3,…,12
(5)
为将系数矩阵转换成一维向量,使用平方和开根公式得到一个新的MFCC系数向量F,
Fi=+/#+&+d;+ef+/7+gf++if+J;
(6)
分别将3类雨量MFCC系数表中的数据转化为一维行向量,得到的1X12维数据作为雨声信号的特征向量。3类雨量的一维MFCC系数见表1。
表13类雨声信号MFCC系数
大雨9.00014.1721&44910.32319.96512.7409.202&997 6.400 4.119 2.490 1.609中雨19.99330.41110.98616.07916.32011.1849.631 6.4858.746 5.817 2.044 1.101小雨46.78553.9143&83613.4199.6727.1827.7207.187 6.275 6.183 2.0750.940
38气 象 科 技第47卷
3雨量识别
3. 1 BP 神经网络训练
本文使用雨声信号进行雨量识别的模型是BP
神经网络,在众多的神经网络中应用最为广泛。这 是一种带有隐含层的前馈神经网络。图5是BP 神
经网络的拓扑结构,包含输入层、隐含层及输出层。 在前向传递的过程中,输入信号从输入层经隐含层
逐层处理,直至输出层。每一层的神经元状态只影
响下一层小1。如果在输出层不能够得到期望的输 出值.则转为反向传播.根据预测误差,调整整个神 经网络的权值和阈值。
降雨量怎么测量的图5 BP 神经网络拓扑结构
图中X, ~X,2是BP 神经网络的输入值.即前 期提取的雨声信号的特征值MFCC 系数,X ,Y,,Y 3
为预测值,此处分别代表大雨,中雨和小雨。5“和
3“是神经网络的权值。从拓扑结构图可以看出,
BP 神经网络表达了非线性函数的映射关系。隐含
层的计算公式通常采用:
n = /a + P + 0 (7)式中,”是隐含层神经元个数,a 是输入层个数,p 为输出层个数。0是口,10]之间的整数。因前期提
取12维MFCC 系数作为雨声特征,故输入层节点 设置为12,输出层节点是3,隐含层节点数取6。
在进行雨量识别前.首先要训练一个BP 神经
网络.使得网络具有一定的联想记忆和预测能力。
网络的训练步骤主要有:
(1) 根据输入层、隐含层、输出层上所设置的节
点数.初始化三层神经元之间的连接权值s .八3”*,
初始化隐含层阈值a ,输出层阈值几给定学习速率
和神经元激励函数。
(2) 根据输入向量X .输入层和隐含层间的连
接权值以及隐含层阈值a ,计算隐含层输出H • 计算公式为:
Hj = /'(》3,肿,—aj ) j=l,2,…,6
(8)
(3) 同理作输出层计算,令预测输出为
6
O* = A Ha,.* — b* k = 1.2.3
(9)
/-I
(4) 误差计算:“=«—(入 (10)
(5) 权值、阈值更新。
(6) 判断迭代是否结束,若没有返冋至第2步。
3.2雨量识别
雨量大小的识別结果是判断系统町行性的重要
指标.将BP 神经网络用于对雨声特征信号分类,其
算法模型分为BP 神经网络的构建、训练和分类,如
图6所示化
在进行神经网络预测前.对数据进行归一化是
常做的处理方法。将所有数据转化为[0,1]之间的
数.其目的在于避免各维数据之间数量级的差别.避 免因为输入输出数据的数量级差别较大而造成较大
的网络预测误差。将3类雨声信号的MFCC 系数 向量进行归一化,如图7所示。
由图7可以看出,3类雨声信号的特征向量有
显著区别,大雨MFCC 系数向量的特征主要集中在
维数2、3、5上,中雨集中在1、2维数上,而小雨
MFCC 系数向量主要集中在1、2、3上且在其余维
数上分布比较均匀。因此可知.MFCC 系数适合作
为雨声信号的特征参数.能够为分类器设计及雨量 识别提供可靠参数。
图6 BP 神经网络分类算法流程
BP 神经网络构建
->
BP 神经网络训练
、f
Y >
BP 神经网络分类
a
—>
构建合适的 BP 神经网络
BP 神经网络
初始化
—>
BP 神经网络
训练
■xQll 练结束〕>-
BP 神经网络
分类
测试
数据
第1期
丁苑等:基于雨声识别的雨量测量方法39
0.6000. 500
jyl 0. 400凉 0. 300
0. 2000. 100
0.000il I Illi.
12 3 41011 12
0. 7000.600対 0. 500瘵 0. 400廉 0. 300
0. 2000. 1000.000
(b).
11
-1.5
5 6 7 891
2 3
4
5 6 7 8 9 10 11 12
0. 7000. 6000. 500§ 0.400
能 0. 300
0. 2000. 1000. 000
2
3
4
5 6 7 8 9 10 11 12
维数
图7 大雨(a ),中雨(b ),小雨(c )声信号MFCC
_2 I I [ 1 I _________|0 5 10 15 20 25 30
测试样本
图9 BP 网络分类误差
表2雨量分类正确率
大雨中雨小雨
正确识别率75%100%80%
系数归一化特征向量
将提取出的大南、中南、小雨的MFCC 系数数据 分别存于 mydatal. mat, mydata2. mat, mydata3. mat
数据库文件中,3类雨声信号分別用1,2,3标识。根
据标识号,令大雨的期望输出向量为[1 0 0].中雨为
[0 1 0],小雨为[0 0门。随机选取雨声信号60组
特征值作为训练样本.学习速率设置为0.03。最后
30组为测试样本,图8〜9是实际雨量与预测雨量
的分类对比识别和BP 神经网络分类误差。随之也 得到神经网络的正确识别率,其结果如表2所示。
*预测雨量类别 亠实际雨量类别
題冢
丟絲匮体、
B ®1
3
2.82.62.42.221.8
1.61.41.2
测试样本
20
*
30
图8预测雨量与实际雨量分类对比
4结论与讨论
本文根据不同降雨强度下的雨声信号差异,提 出通过收集雨声信号后提取其MFCC 系数作为特
征向量,训练神经网络对雨量大小进行识别的新型
雨量测量方式。
(1) 通过对比不同雨量下声信号的幅值归一化
后的波形图可知3类雨声信号在频率、幅值上均有
明显差异.这种差异性使得通过声信号识别雨量大
小成为可能。
(2) 提取出的雨声信号MFCC 系数特征向量很
好地体现了 3类雨量的特征,使得不同降雨强度下 产生的声信号差异通过数据形式体现•便于后期分 类器的设计,表明了该静态特征适用于对雨声信号
的描述。后期使用差分算法等方式可进一步地提取 雨声信号的动态特征参数.满足雨量精准测量的更
高要求。
(3) 根据BP 神经网络对雨量大小的识别结果
可以看出,在少量样本的训练下,对降雨强度的识别
就有十分显著的效果。随着实际运用中,学习样本 数量不断增加.由于BP 网络具有良好的自组织及
自适应能力”,识别正确率将进一步提高。
事实表明,基于雨声信号的雨量识别技术具有 可行性和有效性•随着正确率的提升.进一步,
可实
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论