基于混合聚类分析的共享单车停放点位置合理性研究
基于混合聚类分析的共享单车停放点位置合理性研究
王霞;宋树华;汤军;刘远刚
【摘 要】针对共享单车停放点位置优化的问题,以现有的共享单车停放点位置作为初始聚类中心点,对共享单车的定位数据做聚类,并且提出了结合K-MEANS聚类和缓冲区分析的混合聚类方法,来解决初始聚类中心点相靠近时出现的共享单车错误分类问题.将最终聚类结果作为建议的共享单车停放点位置,进而依据建议的共享单车停放点位置判断现有的共享单车停放点位置的合理性,实验结果表明这种混合聚类方法的聚类效果理想.
【期刊名称】《数字技术与应用》
【年(卷),期】2019(037)007
【总页数】4页(P58-61)
【关键词】混合聚类;共享单车;停放位置;合理性
【作 者】王霞;宋树华;汤军;刘远刚
【作者单位】长江大学地球科学学院,湖北武汉 430100;江苏智途科技股份有限公司,江苏扬州 225000;长江大学地球科学学院,湖北武汉 430100;长江大学地球科学学院,湖北武汉 430100
【正文语种】中 文
【中图分类】TP301.6
共享单车作为中国“新四大发明”之一,弥补了市民出行过程中“最后一公里”的空白。它为市民个人的出行需求提供了极大便利,但是共享单车的过度投放和疏于管理也阻碍着城市文明的建设[1]。
xp共享共享单车停放点位置的确定是展开共享单车规范化管理工作的第一步,在停放点选址问题上[2-5],很多学者都选择采用划分法[6,8]或者层次法[7,8]对共享单车位置分布数据进行聚类。这些聚类方法得出的聚类结果未考虑已规划停放点的位置合理性,而且当已规划停放点的中心位置相邻时,聚类的结果并不理想。
本文提出了结合K-MEANS聚类[9]与缓冲区分析的混合聚类方法,基于模拟数据采用混合聚类
方法对停放点的位置合理性进行判断,以求得到在已规划的停放点中心位置相邻情况下理想的聚类结果。
1 共享单车停放点位置合理性分析
1.1 共享单车停放点位置合理性问题分析
评价一个停放点的位置是合理的,即要避免出现以下情况:(1)已经施划的停放点内没有或长期只有很少数量的单车停放;(2)在经常有一定数量单车停放的地点没有施划停放点。现有停放点的选址主要依靠政府的土地规划政策和规划人员的经验,存在一定施划上的合理性但是对停放需求点的预测还不够准确。
普遍认为,单车的停放位置在空间上数量多且集聚,则空间上形成的集聚区域可视为有单车停放需求的地点。由此可见,停放点的施划与共享单车停放位置的分布情况有很大的关联性,因此可以借助共享单车的定位数据结合现有停放点位置数据做聚类分析,得出的聚类结果的中心位置为有单车停放需求的地点,以有单车停放需求的地点为依据再对现有停放点的位置做出调整,能够提高共享单车停放需求点预测的准确度。
1.2 基于混合聚类的共享单车停放点位置合理性判断
本文提出的混合聚类结合了K-MEANS聚类和缓冲区分析[10],本文称引入缓冲区分析的聚类为缓冲区聚类。缓冲区聚类是为了解决现有停放点位置靠近时,可能会出现单车定位数据错误分类的情况。缓冲区聚类在以下应用场景中有现实意义,比如现有停放点施划在较狭窄马路的两边或是密集施划在商业繁华地段时,若只对单车定位数据进行简单的聚类,那么可能会出现聚类结果不准确的结果。
下面从缓冲区距离和缓冲区聚类算法描述两方面说明缓冲区聚类。
1.2.1 缓冲区距离确定的算法描述
在进行缓冲区聚类之前首先要确定缓冲区距离,确定缓冲区距离的情形见图1,基于共享单车停放点的形状为矩形这一条件假设,需要输入的数据为现有停放点区域数据M,确定缓冲区距离的算法如下:
(1)计算M两两之间中心点距离D,取min{D}的两个现有停放区域记为停放区域1(R1)和停放区域2(R2);
(2)确定line1和line2的直线方程;
(3)计算d1和d2;
(4)确定ρ0,ρ0=0.5d;判断P(P1、P2)是否在R(R2、R1)上,若P落在R上,则对应的距离为有效距离,反之则为无效距离;取d1和d2中标记为有效距离的计算ρ0,若d1和d2都标记为无效距离,则计算R1所有顶点和R2所有顶点的最短距离标记为有效距离计算ρ0。(注:情形3和情形4为直线斜率为0和无穷的特殊情况,ρ0的计算步骤一样。);
(5)结束算法。其中,M为现有停放点区域数据,M(e,Xe,Ye,length,width,angle),e代表M的编号,Xe代表e的中心点位置的x坐标,Ye代表e的中心点位置的y坐标,length代表e的长度,width代表e的宽度,angle代表e绕(Xe,Ye)逆时针旋转角度; line1为经过R1两个顶点的直线,且R1和R2上的所有顶点分别分布在line1的左右两侧;line2为经过R2两个顶点的直线,且R1和R2上的所有顶点分别分布在line2的左右两侧;d1表示R1上的顶点到line2的最小值;d2表示R2上的顶点到line1的最小值; P1表示d1落在line2上的垂足;P2表示d2落在line1上的垂足;ρ0为缓冲区距离;d为有效距离。
图1 ρ0计算情形
1.2.2 缓冲区聚类算法描述
基于共享单车停放点的形状为矩形这一假设,需要的输入数据为待做缓冲区聚类的停放点区域N和待聚类的单车定位数据集S,算法如下:
(1)遍历N,对N的长度和宽度各扩大ρ0,lengthN=lengthN+ρ 0,widthN=widthN+ρ0;
(2)m=m+1;
(3)遍历S(p,Xp,Yp),判断点p是否在N内,若属于,则(Xp,Yp)∈C m;
(4)计算C m的平均位置做聚类中心C 0 m,
(5)直到(XC0m,YC0m)不变,S=S-Cm;
(6)结束算法。其中,N为待做缓冲区聚类的停放点区域,N(e,Xe,Ye,length,width,angle),e代表N的编号,Xe代表e的中心点位置的x坐标,Ye代表e的中心点位置的y坐标,length代表e的长度,width代表e的宽度,angle代表e绕(Xe,Ye)逆时针旋转角度;S(p,Xp,Yp)为共享单车定位数据集,p表示单车编号,Xp代表单车p的x坐标,Yp代表单车p的y坐标;聚类结果C(m,Cm),Cm是S中
聚成一类的点集;m是聚类编号(初始值m=0);聚类结果中心C0(m,XC0m,YC0m),XC0m是C0m的x坐标,YC0m是C0m的y坐标;迭代次数n,初始n=0。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。