公安交管大数据分析研判建模分析方法研究
公安交管大数据分析研判建模
分析方法研究
文/裘晨璐方艾芬
G要:近年来,公安交管部门顺应时代发展趋势,积极探索大数据和人工智能技术应用,目前已初具规模、初显成效。但总体说来,大数据智能化应用的广度、深度和系统性还较为欠缺。如何丰富大数据分析算法模型,有效支撑道路交通安全形势精准研判,提升大数据对交管业务的支撑能力,是摆在公安交管科技工作者面前的一个现实问题。本文探讨了交管业务应用场景与大数据建模之间的结合方式,提出了一套适用于公安交管业务应用场景的大数据建模方法,旨在为公安交管大数据分析研判工作提供参考。
Abstract:In recent years,traffic management departments have actively explored the applications of big data and artificial intelligence technology in traffic management and have taken some shape and achieved initial results.However,on the whole, the breadth,the depth and the systematicness of the big data application are far from enough.How to enrich the big data analysis models,effectively support the precise analysis and research of road traffic safety situation to improve the supporting capacity of big data to traffic management business is a real problem laying ahead of the scientific and technical workers of public security traffic management.This paper discussed the ways of integrating traffic manag
ement application scenarios and big data mathematical modeling,and proposed a set of big data modeling approaches which were applicable for the application scenarios of p ublic security traffic management so as to provide reference for the analysis and research of big data of public security traffic management.
关键词:道路交通管理,大数据,数学建模
Key words:road traffic management;big data;mathematical modelling
1引言
2018年以来建成的部级公安交通管理大数据基础支撑平台,构建了交管大数据资源池,累计汇聚数据超过1.4万亿条,日增数据13亿条,通过开展大数据碰撞比对,实现了嫌疑车辆秒级预警,各类信息核查秒级响应,但在分析硏判辅助决策方面,总体还停留在信息核查比对和经验模型阶段,大数据深度挖掘、智能分析和融合应用还有所欠缺。
2019年,为充分发挥公安交管大数据应用价值,不断提升科学研判、主动预防、精准治理的能力和水平,公安部交通管理局组织研发部级公安交管大数据分析研判平台(以下简称“部级研判平台”),通过积极探索交管业务应用场景与数学建模之间的结合方式,研发了一批大数据分析模型,提炼形成一套大数据建模方法。本文从业务场景、建模思路、应用举例三个层面阐述公安交管大数据建模方法。
2公安交管大数据建模分析方法
本文所述大数据建模是指针对公安交管特定业务应用需求或场景,将整理、描述、预测数据的过程
抽象为数学模型,并通过计算机技术进行求解。
2.1频次统计建模
日常工作中,经常会遇到各类报表。从数学建模的视角看,业务报表的设计是一个频次统计建模的过程,即设定的时间范围内,统计行为对象的发生次数或数据对象的岀现次数,并结合交管业务场景设计各类报表和图形。
2.1.1业务场景
机动车和驾驶人统计、交通违法统计、交通事故统计等交管常用统计报表。
2/I.2建模思路
根据公安交管业务术语、统计口径、专项行动工作考核方案等,用表格、图表等形式来动态显示各项统计指标的数值、百分比、排名、同比、环比等。
2/I.3应用举例
“重点机动车三率”统计,全国给定时间范围内重点机动车的检验率、报废率、违法处理率。
2.2对比拆分建模
统计指标的对比和拆分是最常用的数据分析方法。对比是指数值间的比较;拆分是将硏究对象的整体分为各个部分、方面、因素和层次,即将数据分类别对比,是对对比的深化。
2.2.1业务场景
交管业务办理态势分析、交通违法查处态势分析、道路交通安全态势分析、信息系统推广使用情况分析等。
2.2.2建模思路
选取不同的分析维度,对比和拆分各项统计指标。
2.2.3应用举例
“重点机动车态势分析”统计辖区内大型公路客运、旅游客运、危化品运输车等各类重点机动车保有量'注册量、注销量,主要地域分布、组成结构及变化趋势情况。
2.3集合运算建模
数据的比对和细分是常见的数据分析方式。从数学建模的视角看,数据的比对和细分是一个集合运算的过程。集合是指具有某种特定性质的对象集体,集合中的每个对象称为集合的一个元素。从数据库的角度看,如果将一张表建模为一个集合,那么表中的每条记录就是集合中的一个元素,多张表数据的比对和细分就是对多个集合进行交集、差集运算。
2.3.1交集碰撞建模
(1)业务场景
、逾期未检验/未报废车辆上路行驶、机动车安全检测违规替检、死亡人员驾驶证处理违法等。
⑵建模思路
对不同业务来源的数据进行组合推理,部分业务办理或行为数据之间应具有排他属性,即两者交集正常情况下应为空集。引入交集碰撞的建模方法,若交集不为空集,则存在异常情况或问题数据。
(3)应用举例
根据规定,驾驶证持有人已死亡的,公安机关应当注销驾驶证。取全国某一时间点前因交通事故导致死亡的人员驾驶证数据为集合A,取这一时间点后有交通违法处理记录的驾驶证数据为集合B。显然,集合A与集合B的交集ACB应为空集,即已死亡驾驶人不可能驾车上路行驶和发生交通违法行为。据此建模,若AnB不为空集,即死亡后的驾驶人仍在处理交通违法,则交集部分为问题数据,见图1。
AHB:死亡后仍处理交通违法的驾驶人
图]交集碰撞建模案例
2.3.2差集比对建模
(1)业务场景
车管所业务未及时归档、交通违法/交通事故数据未及时录入、危化品运输路线未及时审批/签收等。
⑵建模思路
当特定业务的工作具有多个要求,将工作要求予以数集转化后,二者的差集按规定应为空集。引入差集比对的建模方法,若差集A-B不为空集,则存在异常情况或问题数据。
⑶应用举例
按照要求,在道路交通事故现场勘查完毕后24小时内,应将有关信息录入全国道路交通事故处理信息系统。取某一时间点前完成现场勘查的交通事故数据为集合A,取24小时后已完成信息录入的交通事故数据为集合B,理论状态下差集A七应为空集,即所有完成现场勘查的道路交通事故在24小时内均已录入系统。据此建模,若A£不为空集,即尚有完成现场勘查的道路交通事故在24小时内未录入系统,则差集部分为问题数据,见图2。
A:完成现场勘查的交通事嫡据
图2差集比对建模案例
2.4条件判断建模
根据业务规则进行条件判断是目前交管部门最常用的数据分析方式。从数学建模的视角看,基于业务规则的判断就是充分必要条件的梳理和使用过程。公安部制定了一系列业务工作规范,覆盖交管各项业务种类且整个业务办理流程均已实现信息化流转。统_的数据标准'统一的业务流程、统一的核心软件,交管大数据具备业务规则条件判断的必备因素。
2.4.1业务场景
车驾管业务监管、交通违法业务监管、交通违法行为法律适用错误等。
2.4.2建模思路
根据充分必要条件理论,结合具体交管工作场景对需求进行推理,梳理其中P应为q充分不必要条件的情形,若违反该条件,则为问题数据。
2.4.3应用举例
根据《道路交通安全法》规定,饮酒后驾驶机动车的,处暂扣6个月机动车驾驶证,并处1000元以上2000元以下;因饮酒后驾驶机动车被处罚,再次饮酒后驾驶机动车的,处10日以下拘留,并处1000元以上2000元以下,吊销机动车驾驶证;饮酒后驾驶营运机动车的,处15日拘留,并处5000元,吊销机动车驾驶证,5年内不得重新取得机动车驾驶证。经分析,饮酒后驾驶机动车(p1)x且机动车使用性质是营运(p2)是吊销机动车驾驶证(q)的充分不必要条件,即:p\p2—定导致q,但q不一定是因为小、p2o据此建模,抽取关联交通违法处理记录、机动车登记信息和机动车驾驶证吊销记录,发现p\p2中不为q的,则为降格立案(将酒后驾驶营运车辆错误地认定为酒后驾驶)或有案不立问题数据。
建模方法2.5逻辑认知建模
2.5.1业务场景
车驾管业务监管、交通违法业务监管等。
2.5.2建模思路
结合具体业务工作场景,直观判断有悖于逻辑常理的数据,倒推异常情形。
2.5.3应用举例
工作中,个别民警为应付"减量控大”工作考核指标,在农村公路现场查处货车、拖拉机违法载人时,单位时间的查处频次异常偏多,有悖于常理认知,涉嫌虚构交通违法信息,虚增执法工作量。如某市县大队车管所民警,2020年5月25日早8时至晚18时期间,在同一地点现场查处交通违法300余起,违法行为均为“货运机动车违反规定载作业人员”,平均5分钟查处1次,数量偏大、偏离实际,存在弄虚作假的异常情形。
2.6数据规律建模
数据规律建模目标运用推断统计和机器学习方法把数据所隐藏的内在规律萃取和提炼岀来,验证业务经验规律或寻未知的内在规律'并据此预测数据。
2.6.1推断统计建模
(1)业务场景
交管业务办理态势分析、交通违法查处态势分析、道路交通安全态势分析、异常业务监管分析等。
⑵建模思路
运用统计学推断统计的方法,对数据的随机性和不确定性模式进行建模,对数据分布或过程进行推断,寻数据的内在规律和异常。
⑶应用举例
机动车驾驶人考试历来是车驾管业务的重要风险点之一,除考试视频巡检外,常用数据分析方法是对各科目考试合格率进行统计分析,根据业务经验设定阈值,考场、考台、考车的考试合格率过高则触发预警,易于被人为规避。在业务调研过程中,发现部分地方科目二考场考生成绩分布违背随机分布规律,岀现大量考生“连续合格”现象,涉嫌违规考试。部局研判平台的"科目二考试连过连不过异常分析模型”,通过统计学游程检验的方法判断科目二考试考生通过时间序列是否具有随机性,若无法通过游程随机性检验,则判定该考场存在科目二考试连过连不过的异常现象,触发违规考试预警。
2.6.2数据预测建模
(1)业务场景
重点机动车、重点驾驶人交通事故风险预测等。
⑵建模思路
基于已有历史数据,构建机器学习模型,从数据中学到规律并预测未来。
(3)应用举例
部级研判平台的"重点机动车交通安全风险预测模型”以大型公路客车、大型旅游客车、危险货物运输车、重型货车、"营转非”大客车、校车等六类重点机动车为建模对象,关联融合机动车登记管理、交通违法查处、交通事故情况等公安交管历史数据,构建重点机动车交通事故风险预测模型,量化车辆未来发生事故的风险,为实现重点机动车的分类分级管理提供信息支撑。建模步骤为:一是运用特征工程法,筛选出关联性强、预测能力强的指标,纳入重点机动车安全风险指标;二是运用逻辑回归算法,通过模型训练预测车辆未来发生事故的概率;三是生成重点车交通安全评分规则,计算重点车的安全分;四是根据安全分划分高、中、低、微四类体,预测不同体车辆未来发生事故的风险度,如图3所示。
27综合评价建模
分数区间该体事故率水平风险等级
安全分S50平均事故率的2倍以上高风险
50<安全分S60平均事故率的1-2倍中风险
60<安全分三70平均事故率的0.5-1倍低风险
安全分二70平均事故率的0.5倍以下微风险
图3数据预测建模案例
实际工作场景中,经常需要围绕某一特定分析对象,综合多个统计指标进行对比分析,不同指标之间有可能互相矛盾。常用多维分析方法通过"指标规则的叠加”,堆砌罗列大量统计指标,难以给出全面和明确的分析结论。综合评价建模利用不同的数据模型进行计算,将多个评价指标值"合成”为一个整体的综合评价值,进而辅助决策。
2.7.1业务场景
道路运输企业交通安全综合评价、机动车检测站交通安全综合评价、驾驶人培训学习交通安全综合评价等。
2.7.2建模思路
将综合评价类问题建模为多目标决策问题,通过—定的数学模型将多个评价指标值“合成”为一个整
体的综合评价值。
2.7.3应用举例
部级研判平台的“客运企业交通安全综合评价模型”以名下有大型公路客运或大型旅游客运在用车辆的客运企业为评价对象,基于企业名下车辆的机动车登记'驾驶证管理、交通违法和交通事故历史数据,构建客运企业交通安全综合评价模型,量化评价企业交通安全风险等级,指导各地开展企业源头管理,分级分类风险管控,助力交通安全事故预防工作。建模步骤为:一是按企业名下在用车数量划分企业规模,分为大型、中型、小型、微型四类;二是运用特征工程方法,筛选代表性强的指标纳入客运企业安全风险评价;三是根据数据分布和区分度情况,采用爛值法确定指标权重;四是运用TOPSIS法和线性加权
法,计算企业交通安全风险排名;五是根据风险排名划分高、中、低、微四类体,评价企业的交通安全风险等级,如图4所示。
综砂介数据驱动的
指标筛选
和权重计算
风险排名百分位
风险等级分级分类
(业务驱动)
前5%高风险
5%-20%中风睑
20%-50%低风险
50%-100%綁险
图4综合评价建模案例
3小结基金项目:公安部技术研究计划项目"基于数据驱
本文提出一套适用于公安交管业务应用场景的大数据建模方法,旨在为公安交管大数据分析与建模提供一个可参考的思维框架,便于从业者更加条理清晰动的交警执法行为特征分析及异常监测技术研究与应用”(项目编号:2019JSYJA02)o
(裘晨璐方艾芬公安部交通管理科学研究所
道路交通安全公安部重点实验室)
地开展相关工作。本文是部级研判平台的设计与建设过程中形成的关于交管大数据建模方法的总体构想,仍有待在实践应用中不断拓展完善。RTISi

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。