判别分析省会城市和直辖市的研究
判别分析省会城市和直辖市的研究
作者:李广燕
来源:《中外企业家·下半月》 2014年第7期
    李广燕
    (陕西国防工业职业技术学院,陕西省 西安市 710300)
    摘 要:笔者运用R软件对对省会城市和直辖市进行分类(一线、二线和三线城市)。然后依照提取的判别函数对其它城市进行分类预测,以指导经济投资计划等。
985
    关键词:判别分析;城市;分类
    中图分类号:C912.81 文献标志码:A 文章编号:1000-8772(2014)21-0235-02
    聚类分析和判别分析都是根据对象之间的距离远近对对象进行归类,但二者之间的不同点在于,在聚类分析中,一般事先不知道应该将数据分为几类,完全根据数据来确定;而在判别分析中,至少有一个已经明确知道的类别的“训练样本”,利用这个数据,来建立基本的判别准则,并通过预测变量来为未知类别的观测样本进行判别分类。
    通过中国的省会城市和计划单列市主要经济指标 (2002年)情况,建立一些指标数据来对省会城市和直辖市进行分类(一线、二线和三线城市)。然后依照提取的判别函数对其它城市进行分类预测,以指导经济投资计划等。基本数据变量为五个经济指标:年末总人口(万人)、国内生产总值(万元)、工业总产值(万元)、货运总量(万吨)和客运总量(万人)。
    中国几大军区
专科提前批啥意思
    由“组统计量”可以看出,三个城市分类数据统计中,各类的各个指标的均值相互间都表现出较大的差异,这些差异在一定程度上说明对城市的分类有意义,通过分类能体现类别间差异。
    表2至5给出了判别分析的基本数据信息,依次设客运总量、货运总量、年底总人口、国内生产总值、工业总产值为X1、X2..X5,先建立判别函数方程,由表2的“典型判别式函数系数”得F1=2.162+0.009x1+0.002x2-0.006x3-0.001x4+0.009x5;
魏晨新专辑
    F2=0.756+0.008x1+0.001x2-0.006x3-0.035x4+0.022x5;
    这两个函数给出了在Fisher判别中,将五维空间的点向两个方向投影后在新的二维空间中的坐标,系数即为表2中的“典型判别函数系数”。根据这两个函数,从任意一个观测值(本例中共35个观测值,每个观测值有5个变量)都可以算出两个数,即构成新的二维空间的坐标点,这样共可以得到二维平面上的35个点,分布如下图(图6典型判别函数),由图6可以发现,函数1可以很好的区分出一线城市,大致区分出二线和三线,但对二线和三线城市的仔细分类,需要结合函数1和函数2共同来判别,此时效果更好些。由于投影的重要性和特征值的贡献率有关,表3的特征值表中可以看出,函数1的方差贡献率是94.9%,函数2的为5.1%。
   
   
    参考文献:
    [1]吴喜之.统计学:从数据到结论[M].北京:中国统计出版社,2006.2022年立秋时间几点几分几秒钟
    (责任编辑:王伟)行政文员的工作职责

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。