基于混合聚类分析的共享单车停放点位置合理性研究--慧智精品网

基于混合聚类分析的共享单车停放点位置合理性研究

王霞;宋树华;汤军;刘远刚

【摘要】针对共享单车停放点位置优化的问题,以现有的共享单车停放点位置作为初始聚类中心点,对共享单车的定位数据做聚类,并且提出了结合K-MEANS聚类和缓冲区分析的混合聚类方法,来解决初始聚类中心点相靠近时出现的共享单车错误分类问题.将最终聚类结果作为建议的共享单车停放点位置,进而依据建议的共享单车停放点位置判断现有的共享单车停放点位置的合理性,实验结果表明这种混合聚类方法的聚类效果理想.

【期刊名称】《数字技术与应用》

【年(卷),期】2019(037)007

【总页数】4页(P58-61)

【关键词】混合聚类;共享单车;停放位置;合理性

【作者】王霞;宋树华;汤军;刘远刚

【作者单位】长江大学地球科学学院,湖北武汉 430100;江苏智途科技股份有限公司,江苏扬州 225000;长江大学地球科学学院,湖北武汉 430100;长江大学地球科学学院,湖北武汉 430100

【正文语种】中文

【中图分类】TP301.6

共享单车作为中国“新四大发明”之一,弥补了市民出行过程中“最后一公里”的空白。它为市民个人的出行需求提供了极大便利,但是共享单车的过度投放和疏于管理也阻碍着城市文明的建设[1]。

xp共享共享单车停放点位置的确定是展开共享单车规范化管理工作的第一步,在停放点选址问题上[2-5],很多学者都选择采用划分法[6,8]或者层次法[7,8]对共享单车位置分布数据进行聚类。这些聚类方法得出的聚类结果未考虑已规划停放点的位置合理性,而且当已规划停放点的中心位置相邻时,聚类的结果并不理想。

本文提出了结合K-MEANS聚类[9]与缓冲区分析的混合聚类方法,基于模拟数据采用混合聚类

方法对停放点的位置合理性进行判断,以求得到在已规划的停放点中心位置相邻情况下理想的聚类结果。

1 共享单车停放点位置合理性分析

1.1 共享单车停放点位置合理性问题分析

评价一个停放点的位置是合理的,即要避免出现以下情况：(1)已经施划的停放点内没有或长期只有很少数量的单车停放;(2)在经常有一定数量单车停放的地点没有施划停放点。现有停放点的选址主要依靠政府的土地规划政策和规划人员的经验,存在一定施划上的合理性但是对停放需求点的预测还不够准确。

普遍认为,单车的停放位置在空间上数量多且集聚,则空间上形成的集聚区域可视为有单车停放需求的地点。由此可见,停放点的施划与共享单车停放位置的分布情况有很大的关联性,因此可以借助共享单车的定位数据结合现有停放点位置数据做聚类分析,得出的聚类结果的中心位置为有单车停放需求的地点,以有单车停放需求的地点为依据再对现有停放点的位置做出调整,能够提高共享单车停放需求点预测的准确度。

1.2 基于混合聚类的共享单车停放点位置合理性判断

本文提出的混合聚类结合了K-MEANS聚类和缓冲区分析[10],本文称引入缓冲区分析的聚类为缓冲区聚类。缓冲区聚类是为了解决现有停放点位置靠近时,可能会出现单车定位数据错误分类的情况。缓冲区聚类在以下应用场景中有现实意义,比如现有停放点施划在较狭窄马路的两边或是密集施划在商业繁华地段时,若只对单车定位数据进行简单的聚类,那么可能会出现聚类结果不准确的结果。

下面从缓冲区距离和缓冲区聚类算法描述两方面说明缓冲区聚类。

1.2.1 缓冲区距离确定的算法描述

在进行缓冲区聚类之前首先要确定缓冲区距离,确定缓冲区距离的情形见图1,基于共享单车停放点的形状为矩形这一条件假设,需要输入的数据为现有停放点区域数据M,确定缓冲区距离的算法如下：

(1)计算M两两之间中心点距离D,取min{D}的两个现有停放区域记为停放区域1(R1)和停放区域2(R2);

(2)确定line1和line2的直线方程;

(3)计算d1和d2;

(4)确定ρ0,ρ0=0.5d;判断P(P1、P2)是否在R(R2、R1)上,若P落在R上,则对应的距离为有效距离,反之则为无效距离;取d1和d2中标记为有效距离的计算ρ0,若d1和d2都标记为无效距离,则计算R1所有顶点和R2所有顶点的最短距离标记为有效距离计算ρ0。(注：情形3和情形4为直线斜率为0和无穷的特殊情况,ρ0的计算步骤一样。);

(5)结束算法。其中,M为现有停放点区域数据,M(e,Xe,Ye,length,width,angle),e代表M的编号,Xe代表e的中心点位置的x坐标,Ye代表e的中心点位置的y坐标,length代表e的长度,width代表e的宽度,angle代表e绕(Xe,Ye)逆时针旋转角度; line1为经过R1两个顶点的直线,且R1和R2上的所有顶点分别分布在line1的左右两侧;line2为经过R2两个顶点的直线,且R1和R2上的所有顶点分别分布在line2的左右两侧;d1表示R1上的顶点到line2的最小值;d2表示R2上的顶点到line1的最小值; P1表示d1落在line2上的垂足;P2表示d2落在line1上的垂足;ρ0为缓冲区距离;d为有效距离。

图1 ρ0计算情形

1.2.2 缓冲区聚类算法描述

基于共享单车停放点的形状为矩形这一假设,需要的输入数据为待做缓冲区聚类的停放点区域N和待聚类的单车定位数据集S,算法如下：

(1)遍历N,对N的长度和宽度各扩大ρ0,lengthN=lengthN+ρ 0,widthN=widthN+ρ0;

(2)m=m+1;

(3)遍历S(p,Xp,Yp),判断点p是否在N内,若属于,则(Xp,Yp)∈C m;

(4)计算C m的平均位置做聚类中心C 0 m,

(5)直到(XC0m,YC0m)不变,S=S-Cm;

(6)结束算法。其中,N为待做缓冲区聚类的停放点区域,N(e,Xe,Ye,length,width,angle),e代表N的编号,Xe代表e的中心点位置的x坐标,Ye代表e的中心点位置的y坐标,length代表e的长度,width代表e的宽度,angle代表e绕(Xe,Ye)逆时针旋转角度;S(p,Xp,Yp)为共享单车定位数据集,p表示单车编号,Xp代表单车p的x坐标,Yp代表单车p的y坐标;聚类结果C(m,Cm),Cm是S中

聚成一类的点集;m是聚类编号(初始值m=0);聚类结果中心C0(m,XC0m,YC0m),XC0m是C0m的x坐标,YC0m是C0m的y坐标;迭代次数n,初始n=0。

慧智精品网

基于混合聚类分析的共享单车停放点位置合理性研究

发表评论

推荐文章

【中国历史十五讲】读书说明与指导(吴树国)

中药泡脚的历史典故

关于司马迁的历史评价

3-真题专练-沈阳历史中考中国古代史-材料解析题

历史上对陶渊明的评价

热门文章

史记素材作文(实用)

汉代文学和经学的关系

汉代散文知识点总结

中国历史的六条脉络

简述汉代丝绸之路开辟的历史意义

汉代城址与墓区的择地规律

少年读史记汉帝国风云录概括300字

汉代文学在中国文学史中的地位与影响

汉试制度与科举制度的关系

汉代生产方式

汉代的思想大一知识点

汉代的科技成就与文化启示

马王堆汉墓的文化内涵与社会背景从文物解读历史

汉代社会的缩影

汉代经由古丝路上的文化交流与影响

汉书的内容

2022国开中国近代史纲要大作业

汉代经学知识点总结图解

秦汉时期的历史观与历史记载方式

汉代的文化成就

最新文章

中药泡脚的历史典故

关于司马迁的历史评价

“亲亲相隐”现象及容隐制度在中国历史中的演进

人教版七年级中国历史新增文物

国子监历史及简介

列举汉代碑刻隶书10种

标签列表

慧智精品网

基于混合聚类分析的共享单车停放点位置合理性研究

发表评论

推荐文章

【中国历史十五讲】读书说明与指导(吴树国)

中药泡脚的历史典故

关于司马迁的历史评价

3-真题专练-沈阳历史中考中国古代史-材料解析题

历史上对陶渊明的评价

热门文章

史记素材作文(实用)

汉代文学和经学的关系

汉代散文知识点总结

中国历史的六条脉络

简述汉代丝绸之路开辟的历史意义

汉代城址与墓区的择地规律

少年读史记 汉帝国风云录概括300字

汉代文学在中国文学史中的地位与影响

汉试制度与科举制度的关系

汉代生产方式

汉代的思想大一知识点

汉代的科技成就与文化启示

马王堆汉墓的文化内涵与社会背景从文物解读历史

汉代社会的缩影

汉代经由古丝路上的文化交流与影响

汉书的内容

2022国开中国近代史纲要大作业

汉代经学知识点总结图解

秦汉时期的历史观与历史记载方式

汉代的文化成就

最新文章

中药泡脚的历史典故

关于司马迁的历史评价

“亲亲相隐”现象及容隐制度在中国历史中的演进

人教版 七年级中国历史新增文物

国子监历史及简介

列举汉代碑刻隶书10种

标签列表

少年读史记汉帝国风云录概括300字

人教版七年级中国历史新增文物