基于行驶特征画像的高速公路车辆逃费风险神经网络预测模型
物联网技术  2023年 / 第8期
200 引 言
目前,高速公路已经进入缓增期,收费还贷及车辆出行服务成为主要工作内容。在取消省界收费站工程完成后,跨省通行车辆在高速公路上单次出行会产生更大金额的通行费用,因此可能会出现更多的车辆偷逃通行费的现象。早期常见的逃费类型有:两车倒(换)卡、卸车头甩挂、计重货车“垫磅”“加轴”“顶轴”等。随着联网收费时代的到来,逃费方式逐渐趋向于集体化、隐蔽化,出现出入口车牌卡号不符、出入口车型车种不符、通行超时或短时、OBU 位移、车辆U 型和J 型逃费、办理低类型通行证、假冒防疫物资和假冒集装箱运输等新型逃费方式[1]
据业内人士保守估计,一年因逃费而造成的损失,约占全国公路总收入的1%,以交通部统计的2020年度全国收费公路通行费总收入4 868.2亿元为基数粗略估计,公路逃费的金额一年或达数十亿元之巨。如何预防和打击逃费行为,成为高速公路运营管理的重要任务。为解决这一难题,相关学者进行了研究。陈波[2]构建收费站车流量以及通行费预测系统,针对京珠南高速公路2013年某一周的收费数据采用
时序算法对车流量进行预测,采用线性回归预测算法对通行费进行预测,再将预测情况与实际情况进行对比,实现对倒卡、换卡等4种逃费行为的识别。黄志军[3]首次将博弈论知识应用到逃费分析,分析产生逃费的动机和原因,从博弈分析的角度提出了加大处罚力度、更新设备等6条建议,并设计了一套逃费稽查系统,于2006年3月在粤北区域试运行;通过对疑似逃费数据的稽查和分析得出,该区域主要逃费方
式是换牌车(入口挂民用车牌,出口挂军牌)。李松江等人
[4]
建立了基于IGA-IBP 算法的逃费预测模型,对2014年的高速公路收费数据进行训练,准确率达到了95.1%。向红艳等人[5]建立了基于RF-LR 算法的逃费预测模型对逃费行为进行预测,其正确率为91.74%。
从2020年1月1日0时起,全国487个省界收费站全部取消,全网收费系统切换为分段计(收)费模式,其信息采集方式、内容均发生了较大变化。在新模式下,高速公路逃费稽查方法也应更新优化,而以上方法尚需在新模式下得到验证,故本文提出一种基于车辆单次行驶特征画像与神经网络的高速公路车辆逃费风险预测模型。本方法基于取消省界收费站后的收费体系对逃费预测方法进行更新,利用新模式下的收费数据特征集刻画车辆单次行驶特征画像,再利用神经网络模型对逃费行为进行预测,最后通过实验验证其准确性。本方法能在识别和预测逃费行为的同时,体现其逃费方式,便于稽查工作的开展。
基于行驶特征画像的高速公路车辆逃费风险
神经网络预测模型
宣淑敏1,张 波2,孙浩宇3,马 静2,王 磊4,靳引利1,田纪磊1
(1.长安大学 电子与控制工程学院,陕西 西安 710000;2. 陕西交通控股集团有限公司,陕西 西安 710000;3. 陕西蓝德智慧交通科技有限公司,陕西 西安 710000;4. 陕西省高速公路收费中心,陕西 西安 710000)摘 要:
为维护高速公路运营秩序,对逃费车辆进行精准稽查,提出一种基于车辆单次行驶特征画像的高速公路车辆逃费风险预测模型。先通过设计稽查判断特征集和稽查结果特征集来刻画车辆单次行驶特征画像,
从车辆行驶路径、时间、费用等方面建立车辆行驶异常的约束条件,再建立BP 神经网络算法进行训练。在利用神经网络建立高速公路车辆逃费风险预测模型时,对某交控集团稽查系统提供的16 718条稽查数据进行分析,该数据由车辆收费数据、单次行驶特征画像数据、稽查结果三部分组成,最终得到精确率为90.784%的模型。与传统算法相比,该方法拥有较高的准确率。文中还进行了车辆单次行驶特征画像的研究,能在识别和预测逃费行为的同时,清晰了解车辆异常行驶特征,体现其逃费方式,为稽查系统提供有力证据。
关键词:
高速公路;逃费预测;车辆行驶特征画像;神经网络;特征选取;车辆稽查中图分类号:TP39;U491      文献标识码:A      文章编号:
2095-1302(2023)08-0020-05收稿日期:2022-09-23  修回日期:2022-10-21
基金项目:陕西交通控股集团有限公司运营管理分公司科研项目
资助—基于大数据车辆画像的高速公路收费稽查研究(2019-15k )
DOI :10.16667/j.issn.2095-1302.2023.08.006
2023年 / 第8期  物联网技术
21
1 车辆单次行驶特征画像
基于取消省界收费站后的新收费数据,计算分析车辆在路径、时间、费用等方面是否存在异常情况,显示其异常行驶方式,建立时空多维特征模型。绘制车辆单次行驶特征画像需要3个步骤:(1)先在众多高速公路收费数据特征中提取能够完整概括车辆行驶时空特征的典型字段;(2)根据以上特征字段从车辆行驶路径、时间、费用等方面判断车辆行驶是否存在异常;(3)将判断结果全部转换为字符串数据类型,合并为异常代码。
由此可知,画像结果由3部分特征组成:一是直接从收费数据特征字段中提取的典型特征,二是分析得到的逃费行为特征,三是代表稽查结果的特征。1.1 车辆行驶典型特征提取
高速公路收费系统存储了大量的车辆行驶数据,信息种类丰富,包含了静态、动态等多种信息属性,记录了车辆的通行信息、车辆特征以及收费站基本信息等。收费数据主要包括车道数据和门架数据两部分。其中,车道数据含有217个字段,门架数据含有216个字段,共433个特征字段。这些信息字段存储在ETC 或OBU 卡中,包含了较多内容,对于逃费车辆的识别并不是全部有效,这些冗余的数据对逃费车辆的识别反而是一种干扰,并且占据了大量的存储空间,在数据的处理过程中会有较大的影响,使得运行速度变慢,甚至导致结果误差等现象[6]。
为了兼顾数据处理的速度和车辆行驶特征的全面刻画,保留收费数据中49个特征字段,覆盖了车辆行驶时间、空间、路径、介质、对象信息,见表1所列。
表1 车辆行驶重要特征集
序 号字 段序 号字 段1PASSID 26计费方式2入口车牌号码+颜
27OBU 车牌3入口车牌号码
28CPU 卡内车牌
……
……24OUB/CPC 序号编码
48最小费额路径25
CPU 卡编码
49
最小费额路径单元数
1.2 逃费行为特征分析1.
2.1 基本特征
稽查判断即匹配度分析是识别逃费车辆的重要一环。根据收费数据,从车辆行驶路径、时间、费用等各方面判断车辆行驶的特征是否异常,在表1所列行驶特征集的基础上提炼出27个二级特征,见表2所列。
高速公路逃费手段逐渐增多,常见的有中途与对向行驶的车辆交换通行卡、跑大买小、倒挂换挂等。本文将从以上
3个方面,结合稽查判断字段,提出判断车辆是否逃费的方法。
表2 逃费行为基本特征序 号字 段序 号字 段
50出入口车牌相似度64最小费额费用是否匹配51出入口车牌是否相同65最大门架超时时长52入口车牌颜是否相同66是否门架行驶超时53OBU 车牌是否相同67最大超时门架区间54ETC 车牌是否相同68超时门架超时时间串55
出入口车型是否相同69超时门架区间串56OBU 车型是否高于计
费车型70超时区间速度串57是否采用最小费额计费71总行驶时长58是否出口轴数大于出口
车型72是否最小费额路径超时59路径收费单元数占比73最小费额路径超时时长
60路径是否完整74行驶路径类型61路径完整度75轴数与行驶里程数匹配
62路径匹配度76
信息完整度
63门架费用是否匹配
1.2.2 跑长买短
部分逃费车辆中途与对向行驶的车辆交换CPC 卡、ETC 卡或OBU ,达到跑长途交短途的目的。我们可以通过对比出入口的车牌号、车牌颜、OBU 车牌号、ETC 车牌号、车型来识别这种逃费行为。
分析出入口的车牌号,以出口车牌号为参考标准,若出入口车牌号100%完全相同,则在字段[51]判断为相同,否则判断为不相同;考虑到设备识别率的影响,在字段[50]输出出入口车牌号相似度的值。同理,也可对比出入口车牌颜(字段[52])、OBU 车牌号(字段[53])、ETC 车牌号(字段[54])和车型(字段[55])。1.2.3 跑大买小
我国高速公路针对不同车型有不同的收费标准[7],部分车辆篡改通行卡内记录的车型数据,或由于收费员的工作失误[1],导致出现跑大买小即缴费车型与实际车型不一致的现象,从而减少通行费金额。
部分逃费的ETC 车辆的OBU 内记录的车型比实际车型小。通过判断OBU 内车型是否高于出口车型来识别这种行为,并在字段[56]输出。另外,对车型在11~15和21~25之间(即货车和专项作业车),且不是大件运输车,判断其出口轴数是否大于出口车型,并在字段[58]输出。
物联网技术  2023年 / 第8期
221.2.4 倒挂换挂
还有一种常见的逃费方式是中途倒挂换挂或者换货,他们在高速上长途行驶,但是最后在与入口收费站相近的收费站下高速,缴较少的通行费,或者在高速上往返多次,最后只缴一次的费用。其通行卡中的数据与出入口实际车型是一致的,则需要从路径、时间、费用等方面分析其行驶数据来识别这种逃费行为,如路径完整性与缺失情况(字段[59]~[62])、费用匹配性(字段[63]~[64])、行驶超时情况(字段[65]~[73])、行驶路径类型(字段[74])、轴数与行驶里程数匹配情况(字段[75])等。1.3 画像特征码
上述特征结果多为int 型数据,在稽查结果中将其转换为15个varchar 等字符串数据类型的特征(字段[77]~[91]),见表3所列。用特定的字母表示特定的异常。
表3 画像特征码列
序 号字 段序 号字 段77门架筛查代码86行驶时间高于3天78出入口匹配(车牌)87出入口匹配(车型)_
排除拖挂79出入口匹配(车牌相同)88行驶时间异常代码80出入口匹配(车牌颜)
89费用对比异常代码81OBU 车牌匹配90路径类型异常情况
82ETC 卡车牌匹配91信息完整性83出入口匹配(车型)92异常合并编码84出口轴数匹配(出口车型)93偷逃费类型判定85
OBU 轴数匹配(出口车型)
94
偷逃费风险
下面列举式(1)~式(15),对稽查结果特征分别进行解释,其中C i 表示特征对应的第i 个字段。
C C C C C C C C 77616261626162909090909090=≥≥<≥≥<A,
%,%B,%,%X,%,%Y,
61629090<<
%,%
C                    (1)
式中:A 表示路径正常;B 表示路径缺失严重;X 表示实际路径有多跑的可能性;Y 表示路径与最小费额路径不符。后续公式中字母所表示的异常将不一一说明。
C C C 7850508585=≥<
A,%
G,%Z,无法判断                            (2)
无法判断C C C 79515101==
A,H,Z,=                              (3)
无法判断C C C 80525201==
A,I,Z,=                              (4)
无法判断C C C 81535301==
A,L,Z,=                              (5)
无法判断C C C 82545401==
A,S,Z,=                              (6)
无法判断C C C 83555501==
A,K,Z,=                              (7)
无法判断C C C 84585801==
A,U,Z,=                              (8)
无法判断C C C 85565601==高速公路免费2022年具体时间
A,V,Z,=                              (9)
无法判断C t t 867272=≤>
A,h V,h Z,aac aac                            (10)
无法判断C C C 87555501==
A,M,Z,=                            (11)
式中,t aac 为实际行驶时间。与C 83相比,C 87排除了拖挂车出口车型大于入口车型的情况。
无法判断C C C C C C C C C 886672667266726672
0010
1101
=========A,,O,,P,,T,,Z,
(12)
无法判断
C C C C C c 896364636400100
======
A,,Q,,R,Z,
in                        (13)
式中,c in 表示省内实收费用。
C 90=        A,C,D,
E,Z,
正常路径
U 型路径
J 型路径往复路径无法判断
(14)
2023年 / 第8期  物联网技术
23
C C C C C 9176767676905090205020=≥≤<≤<<
A,%Q,%%R,%%Z,
%
(15)
异常合并编码(字段[92])为上述15个稽查结果字段的合并编码,例如:YAAAZAKUZAAPQE 。对合并代码进行进一步分析。根据业务逻辑判定偷逃费类型(字段[93]),具体的偷逃费类型见表4所示。基于神经网络模型预测得到偷逃费风险(字段[94]),偷逃费风险为0到100%之间的概率,概率越大说明逃费风险越大。
表4
主要偷逃费类型
序 号偷逃费类型序 号偷逃费类型1车厢分离异常9恶意往复行驶2换卡逃费10恶意大车小标3屏蔽门架逃费11超时停留4行驶时长超3天12一车多卡(多签)
5收费不符13一车多型6CPC 留卡14非法换货7假冒免费车辆15行驶路径确实
(无入或无出)8
U/J 型行驶
16
改换OBU 设备
由此,可以用一串画像特征码来表示一辆车单次行驶的综合情况,其格式如图1所示。
图1 画像特征码格式
2 逃费风险辨识的神经网络模型
神经网络可以解决特征集和结果的相似性判断问题,而本文需要分析研究车辆行驶特征与逃费判断结果之间的关联关系,符合神经网络所研究问题的特征。本研究在数据清洗的基础上建立BP 神经网络模型,实现对车辆逃费风险的预测。2.1 数据清洗
原始收费数据来源于高速公路主线及收费站车道天线采集,在形成完整收费数据的过程中,由于网络的波动或者存储设备等原因导致了原始收费数据质量较低,通常会有数据缺失和数据错误的情况。
对于数据缺失,常用的方法有均值插补、回归插补、极大似然估计等。针对特殊交通系统数据的填补,孙吉贵等人[8]提出了深度学习的填补方法。张赫等人[9]针对缺失检测器的交叉口流量,利用交通流相关性理论进行预测,给出一种有效的数据恢复的方法。
数据错误是指收费系统识别的数据与真实情况不符,根据实际情况分析错误值产生的原因进行纠正或删
除,使其成为有效数值,提高数据的价值。储浩等人[10]针对动态交通数据,以移动平均方法清洗其中的噪声数据。张俊涛等人[11]将车辆 GPS 轨迹数据的异常值进行分类归纳,并使用对应的处理方法进行纠正。
数据清洗是后续进行风险评测的基础,对结果有重要的影响。
2.2 BP 神经网络模型
BP (Back Propagation )神经网络是1986年由以Rumelhart 和McClelland 为首的科学家提出的概念,是一种
按照误差逆向传播算法训练的多层前馈神经网络,由输入层、隐含层和输出层组成,是应用最广泛的神经网络模型之一,具有非线性映射能力、泛化能力与容错能力,用于函数逼近、模型识别分类、数据压缩和时间序列预测等。
高速公路逃费方式多样,数据表现形式复杂,BP 神经网络作为一个非线性系统,可用于逼近非线性映射关系或一个极为复杂的函数关系,是一种预测逃费风险等复杂问题的较好方法,其拓扑结构如图2所示。其中:输入层神经元
15个,X 1, X 2, ..., X 15分别表示C 77至C 91共15个特征字段;输出层神经元1个,Y 表示逃费风险概
率;隐藏层2层,第一层神经元10个,第二层5个,b ji 表示第j 层隐藏层第i 个神经元
图2 BP 神经网络结构
激活函数的主要作用是加入非线性因素,以解决线性模型表达能力不足的问题。因为神经网络要求在数学上处处可微,所以所选取的激活函数要求其输入和输出也都是可微的。在神经网络中常用的激活函数有Sigmoid 、tanh 、ReLU 和softmax 等。为了方便稽查人员评判风险程度,模型的结果输出需要一个0~100%之间的值,而Sigmoid 的输出正好是在0~1之间,故选择Sigmoid 函数作为BP 神经网络的激活函数,如式(16)所示,其函数图像如图3所示。
Sigmoid e x x
()=
+−1
1                          (16)
物联网技术  2023年 / 第8期
24图3 Sigmoid 函数图像
由于采用Sigmoid 函数作为激活函数,输入值和目标值均不可太大或者太小,否则会使梯度失效。归一
化是要把需要处理的数据限制在一定范围内。首先归一化是为了后面数据处理的方便,其次是保证程序运行时收敛加快,具体作用是归纳统一样本的统计分布性。常用归一化方法有3种:线性归一化、标准差归一化和非线性归一化。根据数据实际情况,本文采用线性归一化方法对数据进行归一化处理。
3 实验与分析
3.1 数据来源
神经网络的训练数据集主要由3部分组成,分别为:某集团稽查系统提供的从2021年6月到2022年1月的稽查车辆结果数据、该部分车辆的收费数据、本项目的车辆单次画像数据。该数据集一共16 718条,其中判定为异常的数据有6 096条,判定为正常车的数据有10 622条。这里对异常的数据进行了过采样,并将测试集和训练集按3∶7进行拆分。3.2 实验过程和处理
采用11th Gen Intel (R ) Core (
TM )*****************处理器、16 GB 内存进行特征处理,处理过程如图4所示。
图4 特征处理流程
采用Python3.7.13版本,在PyCharm 平台上建立并训练BP 神经网络模型,训练过程的主要步骤如图5所示。3.3 实验结果分析
最大迭代次数100次,batch 大小为64,每次迭代用时1.5 s ,得到表5所列的预测结果。其中,TP
(真正)是将正类预测为正类数,TN (真负)是将负类预测为负类数,FP (假
+P R
图5 神经网络训练过程
表5 预测结果
实 际
逃费1未逃费0预测
逃费1TP=2 827FP=287未逃费0
FN=360
TN=1 542
表6 各项指标结果指 标精确率P /%准确率ACC/%
召回率R /%F1/%结 果
90.784
87.101
88.704
89.732
4 结 语
本文依据车辆收费数据提出一种基于车辆单次画像与神经网络的高速公路车辆逃费风险预测模型。由稽查判断特征集和稽查结果特征集来刻画车辆单次行驶画像,从车辆行驶路径、时间、费用等方面描述了车辆行驶特征,根据画像结果并结合BP 神经网络算法进行训练。实验结果表明,与传统算法相比,本方法拥有较高的准确率。文中还进行了车辆单次行驶特征画像的研究,本文方法能在识别和预测逃费行为的同时,清晰了解车辆异常行驶特征,体现其逃费方式,
为稽查系统提供有力证据,方便稽查工作的开展。
当然,由于逃费手段不断新增,因此在今后的应用中还应不断地更新稽查判断特征集和稽查结果特征集,从方法上设计具有自动扩展逃费模式的对抗网络模型,提高对逃费车辆预测的准确度。
注:本文通讯作者为靳引利。
(下转第28页)

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。