变量数据的整理
回顾:统计整是的概念:
统计整理是指根据统计的研究的目的和任务,对统计调查或科学试验获得的大量原始资料进行科学的分类、汇总,或对已经加工过的资料进行再加工,使之成为系统化、条理化、标准化的能反映总体特征的综合统计资料的工作过程。
注意概念的重点:大量原始资料→分类、汇总→系统化、标准化
变量数据的整理恰恰体现了这样一个工作过程
有一组数据:对某班40名学生某科某次考试成绩按试卷登记得到如下资料:
54 60 62 97 85 52 83 79
95 80 89 85 77 68 86 93
70 81 78 89 71 89 80 85
75 78 90 66 78 73 82 82
99 77 88 84 75 88 76 80
分类整理后得到某班40名学生成绩情况
由此可以看出变量数据整理的结果
下面介绍如何完成这一过程,只看基本概念。
(一)变量分布数列的概念
变量分布数列:用数理标志进行分组所得到的分布数列。
单项式变量分布数列:若每一组别都是由单个的组值(整数或小数)表示。
如表:某班学生按年龄分组
15 16 16 15 16
17 16 16 17 16
16 17 17 17 16
15 16 17 17 17
经分组
年龄
学生人数(频数)
15
3
16
9
17
8
合计
20
组距式变量分布数列:若每一组都是由数域(区间)表示。
如前面40名学生成绩
由简单到复杂可看
(二)单项式变量分布数列的编制
某生产组20名工人同种产品日产量如下(单位:件)
13 18 15 19 14 17 13 15 17
19 15 17 18 14 16 15 16 17 16
这是一个离散型变量,其变量值不多,变动范围不大,宜编制单项式变量分布数列。
离散性变量(没有小数)
注意这组数据的特点:变量不多(20个)
变动范围不大(13—19)
所以适合编制单项式变量分布数列。
步骤如下:
(1)按变量值大小顺序排列:
13 13 14 14 15 15 15 15 16 16
16 16 17 17 17 17 18 18 19 19
(2)每种变量值为一组(重复者只取一个),顺序排列为7组:
13 14 15 16 17 18 19
(3)列入表中并汇总出各组频数,如表所示。
20名工人日产量资料
日产量(件)
工人数(人)(频数)
频率
x
f
f/∑f
13
14
15
16
17
18
19
2
2
4
4
4
2
2
2/20
2/20
4/20
4/20
4/20
2/20
2/20
合计
20
1
三、组距变量分布数列的编制
开口组变量分布数列
闭口组变量分布数列
等距变量分布数列
异距变量分布数列
组距变量分布数列
等距变量分布数列的编制方法
等距分组:标志值在各组保持相等的组距。
注意特点:变动均匀、没有大起大落
仍看前面例子:
对某班40名学生某科某次考试成绩按试卷登记得到如下资料:
54 60 62 97 85 52 83 79
95 80 89 85 77 68 86 93
70 81 78 89 71
变量数据的整理 来自淘豆网m.daumloan.com转载请标明出处.