统计资料的整理
第三章统计资料的整理
教学目的与要求:
本章是统计研究活动的第三阶段—统计资料整理阶段,阐述了统计整理的理论与方法,包括分组、汇总和统计表的设计。重点要求为:
1、明确统计资料整理的概念,了解统计整理的步骤。
2、通过学习统计分组理论,能够对不同的社会经济现象进行统计分组。
3、运用分配数列对原始数据进行系统整理。
4、掌握统计表的具体编配方法。
重点掌握:
1、统计分组方法。
2、分配数列的编制与汇总
教学方式:用多媒体课件讲练结合。
课时安排:理论4学时,实训4学时
第一节统计整理的意义和步骤
一、统计整理的意义
1、定义
统计整理,就是根据统计研究的目的,对所搜集到的资料进行科学的加工,使之系统化,条理化的工作过程。统计整理即包括对统计调查所得到的原始资料进行整理,也包括对加工过的综合资料,即次级资料进行再整理。
2、意义
统计整理在整个统计研究中占有重要的地位。统计整理的正确与否,将直接影响和决定着能否完成整个统计研究的任务。如果采用不科学不完整的整理方法,即使搜集到准确、全面的统计资料,也往往使这些资料失去应用价值,掩盖客观现象的本质,难以得出正确的结论。因此,必须十分重视统计整理工作。
二、统计资料整理的步骤
第一步,设计和制定统计整理方案。
第二步,对原始资料进行审核。
第三步,对经过审核的资料进行分组、并结合汇总,计算出总体总量指标。
第四步,将汇总计算的结果,以统计表或统计图的形式表现出来。
第五步,对统计资料妥善保存,系统积累。
第二节统计分组
一、统计分组的概念
统计分组就是根据统计研究的需要,将统计总体按照一定的标志分为若干个组成部分的一种统计方法。例如,将某一班级的全体同学按照性别划分为男、女两个组;对某市100家大型零售商店按照零售额、职工人数进行分组等。
统计分组具有两个方面的含义:
对总体而言,是“分”,即将同质总体区分为性质有别的不同组成部分;
对总体单位而言,它是“组”,即将性质相同或相近的不同总体单位组合在一起,构成一个组。
例如,要了解我国人口状况,只知道总人口数量是不够的,而应将人口总体按照年龄、性别、民族、城乡、文化程度……等分组,才能进一步地深入地了解我国人口总体的年龄结构、性别比例、民族构成等。
二、统计分组的作用
(一)区分现象的不同类型
(二)研究总体的内部结构
(三)分析现象间的依存关系
三、统计分组的方法
统计分组的关键问题是正确地选择分组标志与划分各组界限。前者主要是指品质标志分组,后者主要是指数量标志分组。
(一)分组标志选择的原则
1、要选择能够反映事物本质或主要特征的标志
2、应根据研究的目的与任务选择分组标志
3、根据现象所处的历史条件的变化选择分组标志
(二)统计分组的方法
1、按品质标志分组
按照品质标志分组就是用来反映事物的属性,性质的标志作为分组标志,就可以将总体单位划分为若干性质不同的组成部分。
例如,人口按性别、文化程度、民族、籍贯等标志分组;企业按经济类型、轻重工业、隶属关系,企业规模等标志分组等。
2、按数量标志分组
按数量标志分组就是用反映事物数量差异的标志作为分组标志,将总体各单位划分为若干个组。
例如,地区经济按国内生产总值分组、企业按销售收入分组等。
三、统计分组体系
分组体系有下列形式:
(一)简单分组与平行分组体系
将社会经济总体只选择一个标志分组称为简单分组。对同一总体选择两个或两个以上的标志分别进行简单分组,排列起来,即成为平行分组体系。
(二)复合分组与复合分组体系
复合分组是用两个或两个以上分组标志重叠起来对总体进行的分组。例如,将人口先按“性别”分成男、女两组,然后在男性和女性两组中分别按照“文化程度”划分为大学生及大学以上、高中、初中、文盲及半文盲如下五组:
如果多个复合分组组成的体系就形成了复合分组体系。例如,为了认识我国高等院校在校学生的基本状况,可以同时选择学科、本科或专科、性别三个标志进行复合分组,并得到如下复合分组体系:
第三节分配数列
一、分配数列的概念与种类
定义:在统计分组的基础上,总体中的所有单位按其所属的组别归类整理,并且按照一定的顺序排列,形成总体单位数在各组分布的一系列数字,称为分配数列,又称次数分配或次数分布。
分配数列中,分布在各个组的总体单位数叫次数,又称频数。
如果将分组标志序列与各组相对应的频率按照一定的顺序排列,就形成频率分布数列。
分配数列有两个组成要求:一是分组;另一个是次数或比率。它可根据分组标志的性质不同,可以分为品质数列与变量数列。
(一)品质数列
它是按品质标志分组的数列,用来观察总体单位中不同属性的单位分布情况。例如,分组名称大全
(分组名称)      (次数)      (频数)
品质数列的编制比较简单,但要注意分组时,应包括分组标志的所有表现,不能有遗漏,各种表现相互独立,不得相融。
(二)变量数列
变量数列是将总体按数量标志分组,将分组后形成的各组变量值与该组中所分配的单位次数或频数,按照一定的顺序相对应排列所形成的分配数列。
(各组变量值)        (次数)        (频数)
在组距式变量数列中,需要明确以下概念
1、组限
组限为组距式变量数列中,每组区间两端的极值称组限。每一组的两个组限中,较大者叫上限,较小者叫下限,如果各组的组限都齐全,成为闭口组;组限不齐全,即最小组缺下限或最大组缺上限,称为开口组。
2、组距
组距为每组下限与上限之间的距离为组距。即:组距=上限-下限
组距式变量数列,有等距数列和不等距(异距)数列之分
3、组中值
组中值=2
下限上限+ 对于开口组中值的计算方式可以利用如下公式:
2
邻组组距该组上限缺下限的组中值-= 2邻组组距该组下限缺上限的组中值+
=
二、变量数列的编制
单项式变量数列,可以直接将每一变量值作为一组,
(各组变量值)        (次数)      (频率)
单项式变量数列的编制比较明确、容易。但是用连续变量分组来编制分配数列时,或者虽是离散变量,但数值很多,变化范围很大时,单项数列就不能适用,而应考虑采用组距数列的形式。 (二)组距变量数列的编制
以下举例说明:
[例1]对某企业30个工人完成劳动定额的情况进行调查,某原始资料如下(%)
98  81  95  84  93  86  91  102  100  103
105  100  104  108  107  108  106  109  112  114
109  117  125  115  120  119  118  116  129  113
第一步:计算全距
将各变量值由小到大排序,确定某最大值,最小值,并计算全距。
变量的最大值是129%最小值是81%
全距 = 最大值 - 最小值=129% - 81%= 48%
第二步:确定组数和组距
在等距分组时,组距与组数的关系是:
组数
全距组距:或,组距全距组数== 本例中根据一般将成绩分成优、良、中、及格和不及格的五档评分习惯,可以先确定组数为5。在等距分组时,计算组距如下:
%6.95%48==组距

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。