基于百度热力图的人动数量提取与规划应用
张海林
于百度热力图的人动数量提取与规划应用摘要:百度热力图是一种能动态反映城市人口聚集特征的互联网开源数据,用于交通规划设计能有效降低数据分析成本,弥补传统人口数据时效性和动态性不足的问题。提出一种百度热力图人动数量提取方法:根据研究尺度对热力图范围进行网格划分,构建人口聚集密度重分类函数,计算网格内人动总数并转换为点要素。对参数进行敏感性分析,发现网格大小影响数据的颗粒度,而地图缩放级别影响人动总数。以广州市环城高速公路以内的区域为例进行不同方法的对比分析,表明该方法适用于规划设计的横向比较研究。最后,以广州市临江大道景观带为例,将数据应用于公共停车场规划选址。
关键词:规划设计;互联网大数据;百度热力图;人动数量;地图缩放级别
Extracting Active Population Data Based on Baidu Heat Maps for Transportation Planning Appli-cations Zhang Hailin
(Guangzhou Urban Planning &Design Survey Research Institute,Guangzhou Guangdong 510060,China)Abstract :The Baidu heat map provides the open-source data on Internet,which can dyn
amically dis-play the characteristics of urban population aggregation.Utilizing such open-source information effec-tively reduce the cost of data analysis and make up for the lack of timeliness and dynamics of tradition-al population data in transportation planning and design.This paper proposes a method of extracting active population data through the Baidu heat maps to construct a population aggregation reclassifica-tion function that can be used to calculate the total number of activities of the population in the grid de-fined by scope of research,which leads to the key activity points.The parameters 'sensitivity analysis reveals that the grid size affects the data resolution,while the map zooming level affects the total num-ber of population activities.The results of a comparative analysis with Guangzhou Ring Expressway demonstrates the suitability of this method for horizontal comparative study of planning and design.Fi-nally,taking the Riverside Avenue landscape belt in Guangzhou as an example,this paper applies the data to the public parking lot planning and site selection.
数字大写怎么写0到10Keywords :planning and design;Internet big data;Baidu heat map;active population data;map zooming level
收稿日期:2020-09-11
作者简介:张海林(1987—),男,湖南衡阳人,硕士,高级工程师,主要研究方向:交通设计、交通规划。E-mail:***********************
张海林
(广州市城市规划勘测设计研究院,广东广州510060)
文章编号:1672-5328(2021)03-0103-09中图分类号:U491.12文献标识码:A DOI:10.13813/j11-5141/u.2021.0306
0引言
人口是交通规划设计的重要基础信息和决策依据,是影响各类设施布局的主要因素,如何高效、准确地获取人口数据是规划设计的关键问题之一。传统的人口数据获取方式通常采用人口普查和调查访谈,但随着城市规模扩大和发展转型,社会体的异质化和生活方式的多元化使城市人口时空行为
特征日益复杂,导致更新速度慢、时间相对滞后。近年来,随着规划行业中大数据应用的普及,以手机信令、公共交通刷卡、百度热力图和微博签到等为代表的多源位置数据在城市研究中得到广泛应用[1-2]。通过位置大数据的挖掘和分析,可为交通规划设计中的调查、分析和评估提供实时、客观的视角,弥补了传统数据调查的时效性和动态性不足等问题。
基于百度热力图的人动数量提取与规划应用
103
Urban Transport of China Vol.19No.3May 2021
市交通二○二一年第十九卷第三期
图1百度热力图颜与人口聚集密度对应关系
Fig.1Correspondence between color and population aggregation in Baidu heat maps
资料来源:文献[8]。
蓝浅蓝青绿黄橙红
人口聚集密度/(人·hm -2)
缺省缺省≤10>10~20>20~40>40~60>60
百度热力图是一款以智能手机用户使用具有定位功能的手机百度软件为基础的数据产品,以不同的颜及亮度动态反映人动空间的聚集程度。尽管百度热力图不是准确的人口分布数据,但它相较于手机信令和公共交通刷卡等运营商数据更易于获取,在规划设计领域得到了大量的应用探索。应用实践主要集中在三个方面:1)研究人口聚集时空特征,例如聚集度、聚集位置、人口重心等指标,进而对城市空间结构进行评价和优化[3-6];2)构建职住平衡指数,探讨城市职住空间特征
节能节电[7-9]
;3)评价绿地公园等公共空间的活力等级,为城市公共空间的品质提升提供量化支撑[10-12]
。这些实践表明经过挖掘和
处理后的百度热力图用于规划设计具有可
行性。
百度热力图是经过数据渲染处理的图片数据,属于栅格类型,无法直接显示或读取人动数量,因此用于规划设计时需要进行数据挖掘,提取能反映人动的数量指标,现有研究以规划应用为主,较少关注人
动数量提取方法的总结及数据适用性分析。因此,本文基于现有研究,根据规划设计不同层面的数据需求,研究提出一种更具普适性和可操作性的百度热力图人动数量提取方法,并通过关键参数的敏感性分析,探讨百度热力图数据在规划设计中的应用要点。
1研究回顾
1.1百度热力图数据基本特征
1)数据原理。
百度热力图的工作原理是以亿级规模手机用户为基础,基于用户访问百度产品(如地图、搜索、天气、音乐等)时的位置信息,统计不同区域内的人动数量,经过密度分析处理后在百度地图上可视化。
2)数据特征。
苏州景点百度热力图是一种时空数据,以不同颜和亮度实时描述城市中人的空间分布情况,共包含七种颜
,分别为红、橙、黄、绿、青、浅蓝、蓝,代表不同的人口聚集密度(见图1)。百度热力图数据具有时效性,每15min 更新一次,且只在14~18级地图缩放级别中显示,地图缩放级别越大,图片细部显示越详细(见图2)。
1.2现有处理方法总结
百度热力图数据统计是基于某一时刻访问百度产品的手机用户,尽管用户量为亿级规模,但仍属于抽样数据,因此主要用于规划设计的横向比较研究中。现有数据处理方法大致分为热区面积法和活动数量法(见表1)。
热区面积法不考虑图片颜与人口聚集密度的真实关系,而是将图片颜赋予
1~7
a 15级缩放级别
b 16级缩放级别
c 17级缩放级别
图2不同缩放级别下百度热力图显示对比Fig.2Baidu heat maps at different zooming levels
104
张海林
基于百度热力图的人动数量提取与规划应用的自定义热度数值,用热度数值替代人口聚集密度,通常1~3级为低热区(对应蓝、浅蓝和青),4~5级为次热区(对应绿和黄),6~7级为高热区(对应橙和红),再通过矢量化分别提取各热区的面积,最后以热区面积的大小来比较人动数量。方法假定在相同区域范围内,高热区的面积越大则区域内的人动数量越大[5]。该方法操作简单,但采用高热区(包括橙和红区域)面积值作为人动数量的衡量指标,未考虑不同热区人口聚集密度的差异,影响数据结果的准确性。例如面积相同的A 和B 两个高热区,A 区全为红,B 区全为橙,利用该方法得到的人动数量相同,实际上由于红区域的人口聚集密度高于橙区域,A 区的人动数量也应大于B 区。
电视机什么牌子好活动数量法将百度热力图的颜与人口聚集密度进行关联,先通过矢量化提取区域内各类颜的面积,再乘以对应颜的人口聚集密度值,求得区域内各颜对应的人动数量,最后将区域内各类颜的人动数量求和得到区域人动总量。在相同区域范围内,人动总量越大,说明区域内的人口聚集越密集[8]
。该方法数据准确性
较高,具有较好的可比性,但通常以整个城市、行政区或街区为数据统计范围,数据颗粒度较大,主要用于中观和宏观层面的研究,如果用于微观层面的规划分析,还需进一步缩小数据的颗粒度。
2人动数量提取方法
2.1数据要求
百度热力图应用于交通规划设计的核心是通过提取能表征人动强度的时空指标揭示城市人口时空变化特征。考虑宏观、中观和微观层面的不同需求,数据应满足三个
要求:1)能将百度热力图颜与人口聚集密度进行关联,以提高数据的准确性和可比性;2)能根据研究尺度提取不同颗粒度的数据,以满足不同层面的分析需要;3)能将结果数据转换为点要素,方便在ArcGIS 等地理信息平台进行空间分析。
2.2提取方法流程
以活动数量法为基础,结合数据要求,提出方法流程(见图3)。该方法包括5个主要步骤,具体可在ArcGIS 中予以实现。
1)数据预处理:对百度热力图原始数据进行裁剪、地理配准及投影转换;
2)重分类:依据热力图颜与人口聚集密度的对应关系对数据重新进行分类;
灰雀ppt课件3)网格划分:根据研究尺度及数据颗粒度要求,将热力图范围划分为规则或不规则的网格,以便后续提取不同颗粒度的数据;
4)人动数量统计:结合栅格像元面积、人口聚集密度,计算各个网格内人动总数;
5)结果输出:将结果输出为点要素。
2.3关键流程要点
1)重分类。
为实现人动数量结果的准确性和可比性,需将百度热力图的颜与人口聚集密度形成对应关系,
既有研究中不同颜仅有人口聚集密度的区间值,且蓝和浅蓝对应的人口聚集密度存在缺失,无法直接用于人动数量提取,需要进一步细化。
经研究发现,百度热力图数据的Alpha 通道(第4个通道)数值范围为60~194,与图片颜存在区间连续对应的关系(见表2)。由于各个颜的Alpha 值区间连续且不交叉,因此研究假定图片颜对应的人口聚集密度与Alpha 值为一元线性关系,则可建立人口聚集密度重分类函数。
P i =ìíî
ïï
ïïïïïïïïïïïïïï10-0151-60×()SA i -60,60≤SA i ≤151()蓝、浅蓝、青20-10163-151×()SA i -151,151<SA i ≤163()绿40-20170-163×()SA i -163,163<SA i ≤170()黄60-40179-170×()SA i -170,170<SA i ≤179()橙60,179<SA i ≤194()红,
式中:P i 为第i 个栅格的人口聚集密度/(人·hm -2),SA i 为第i 个栅格的Alpha 通道
值。按照上述分类函数,即可对百度热力图数据进行重分类,重分类后的栅格像元像素
105
Urban Transport of China Vol.19No.3May 2021
城市交通二○二一年第十九卷第三期
值即为对应的人口聚集密度值。
2)网格划分。
划分网格的目的是提取不同颗粒度的数据,以满足不同层面的分析需要,同时为结果数据转换为点要素提供基础。网格大小需考虑研究区域面积和数据处理效率两个因素,网格越小,划分出的网格数量越多,提取的数据颗粒度越小,但会增加数据处理时间;反之网格越大,数据处理时间越短,但提取的数据颗粒度越大。由于百度热力图中一个像元的实际宽度约为2(18-zl)m (ZL 为缩放级别),14~18级缩放级别对应1.0~16m ,因此考虑地图分辨率的影响,网格大小不宜小于20m 。在实际规划设计中,城市或片区层面通常将网格大小设定为1000m×1000m ,街区或街道层面可将网格
大小设定为50m×50m 。
3)人动数据统计。
通过像元大小S z 、栅格人口聚集密度P i 求得每个像元上的人动数量,再将网
格中各个像元的人动数量求和,即可得到该网格内的人动数量Z j ,其中像元大小S z 应与投影后栅格属性中的像元大小值一致。即Z j =∑j ,i
()S z ×P j ,i ,式中:j 为
网格序号;P j ,i 为第j 个网格内第i 个栅格
的人口聚集密度/(人·hm -2)。在得到每个网格的人动数量基础上,整个研究范围内的人动数量可表示为P =∑j =0
n Z j 。
2.4测试结果
在ArcGIS 中通过模型构建器建立工作流,输入数据为百度热力图原始数据和网格尺寸大小,输出结果为带有人动数量值的点要素。图4为部分过程数据,其中输入的百度热力图缩放级别为16级,网格大小为200m×200m ,从结果来看,人动数量与原数据的人口空间分布趋势基本一致,表明上述方法具有可行性和可操作性。
3参数敏感性分析
研究方法流程涉及网格大小和百度热力图缩放级别两个参数,为分析其对提取数据
结果的影响,对这两个参数分别进行敏感性分析。
3.1网格大小
网格大小决定了结果数据的颗粒度。以广州市环城高速公路以内的区域为例,百度热力图为16级缩放级别,统计时长为连续24h ,间隔为1h ,网格大小分别为100m ,500m 和1000m ,统计结果如图5和表3所示。可以看出,不同网格大小的人动数量时间变化趋势完全一致,人动数量在
表1百度热力图数据现有处理方法对比
Tab.1Existing handling methods for Baidu heat map data
方法名称热区面积法活动数量法
处理流程
划分低热区、中热区和高热区;矢量化提取各热区面积;统计研究区域内高热区面积矢量化提取各类
颜的面积;统计各类颜的人动数量;统计研究区域内人动数量
优点
操作
简单数据准确性较高
缺点未考虑不同热区人口聚集密度的差异,数据结果的准确性欠佳以整个城市、行政区或街区为数据统计范围,数据颗粒度较大
应用场景城市空间结构研究职住平衡研究
资料来源:依据文献[5,8]整理。
图3百度热力图人动数据提取方法流程Fig.3Exacting active population data based on Baidu heat maps
表2人口聚集密度与Alpha 通道值的对应关系
Tab.2Correspondence between population aggregation and Alpha channel value
颜既有方法人动密度值/(人·hm -2)Alpha 通道值
60~132
浅蓝
>132~138
青≤10>138~151
绿>10~20>151~163
黄>20~40>163~170
橙>40~60>170~179
红>60>179~194
106
张海林
基于百度热力图的人动数量提取与规划应用5:00—10:00急剧上升,10:00—22:00变化相对平稳,22:00—次日5:00急剧下降,这与
城市人动规律基本吻合。在同一时刻点上,三组数据的差异均不超过±0.15%,可认为人动数量基本一致,这与城市人口分布规律也基本吻合,即同一区域、同一时间内的城市人口数量具有稳定性。上述分析结果表明,在相同地图缩放级别的情况下,网格大小不会造成人动总数的差异,而主要影响结果数据的颗粒度。
3.2地图缩放级别
不同地图缩放级别下,百度热力图的显示存在较大差异。为分析地图缩放级别对数据结果的影响,仍以广州市环城高速公路以内的区域为例,网格大小为500m ,统计时长为24h ,间隔为1h ,分别提取
15级、16级和17级3个缩放级别的人动数据,结果如图6和表4所示。可以看出,在10:00—22:00人动平稳区间,相邻缩放级别之间的人动数量相差约30%~40%;23:00—次日10:00,相邻缩放级别越大,人动数量上升或下降的趋势越快;在5:00左右,3个缩放级别的人动数量基本接近,差异约在1.5%左右。不同缩放级别下人动数量随时间的变化趋势仍大体一致,但在数量上差异较大,总体上缩放级别越大,人动数量越小。可能原因是随着地图缩放级别的减小,热力图中红区域面积占比增大,因此提取到的人动数量越多。上述结果表明,在网格大小相同的情况下,不同地图缩放级别会造成人动总数的显著差异,在使用百度热力图数据进行交通规划设计时,数据提取应在同一缩放级别下进行,并需根据研究范围大小,合理选择
地图缩放级别。张家界风景区位于我国的哪一个省份?
4规划应用场景
4.1数据优缺点
为对比数据优缺点,以广州市环城高速公路以内的区域为例,分别采用本文方法、热区面积法和活动数量法进行分析,百度热力图地图缩放级别为16级,时间为11:00。参数取值上,本文方法网格尺寸为200m ,热区面积法中热区分类标准与既有研究保持一致,活动数量法中人动密度值采用区间均值,并以街镇为统计单元,结果如图7所示。由于三种方法的数据结果及尺度不同,难以进行具体量
化比较,因此,结合规划设计数据要求,从结果数据与原始数据(见图7a)人动聚集趋势一致性、是否直观体现人动数量高低、数据颗粒度能否体现不同区域人口聚集密度差异三个方面进行对比分析。
从结果可以看出,热区面积法(见图
7b)
a 网格划分结果(200m×200m)
b 重分类结果
c 人动数量提取结果
缺省≤10(10,20](20,40](40,60]>60
图4人动数量提取示例
Fig.4Exacting population activities data
65人动数量/万人
554535255
151000m 500m 100m
23:00
21:0019:0017:0015:0013:0022:0020:0018:0016:0014:0012:0011:009:007:005:003:001:0010:008:006:004:002:000:00时刻
图5不同网格大小的人动数据变化对比
Fig.5Active population data at different grid sizes
107

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。