第四章数据分布特征的描述
统计数据经过分组整理以后,基本可以反映数据分布的特征和类型。为了进一步掌握数据分布的变化规律,可以从三个方面更深一步对数据分布的特征进行描述。
第一节数据分布集中趋势的侧度
所谓集中趋势就是直属局向中心之靠拢的倾向。表现总体数据分布集中趋势的主要指标就是各类统计平均数。
统计平均数又称平均指标,是表明同类社会经济现象在一定时间、地点、条件下所达到的一般水平的代表性指标。例如,用平均工资代表职工工资的一般水平;用平均亩产量代表粮食生产的一般水平等。
平均数的计算方法通常有两种:一是根据各项数据来计算的平均指标,成为树枝平均数。常用的树枝平均数有算术平均数、调和平均数和几何平均数。二是根据特殊位置上的数据来确定的平均数,成为位置平均数,常用的位置平均数有众数和中位数。
一、算术平均数
算术平均数是计算平均指标的最常用方法和最基本的形式。这是由于社会经济生活中存在的大量情况是:社会经济现象总体的标志总量为总体各个单位标志值的算术和。如,企业职工的工资总额是每个职工工资加总而得到的;某校学生总人数是全校各班人数的总和。在这种情况下,平均指标最适合采用算术平均数的形式,基本公式如下:
在实际工作中,由于掌握资料不同,算术平均数可分为简单算术平均数和加权算术平均数两种。
(一)、简单算术平均数。
简单算术平均数就是将总体各单位的标志值简单加总,除以总体单位数而求得的平均数。它适用于未经分组的原始资料计算算术平均数。
例如,某市抽查10户家庭的住房面积如下:55,75,75,90,90 ,90 ,90 ,105,120 ,150,求平均每户的住房面积。计算如下:
55+75+75 + 90 + + 150
平均的住房面积= ——————————————= 94 平米
10
将上述计算用公式表示为:
式中: 代表算术平均数;
x 单位标志值(变量值);
n 代表总体单位数(项数);
∑是总和的符合。
(二)、加权算术平均数。
当掌握的资料是分组资料,并已编成了分布数列,且各组次数不相等时,就需要采用加权算术平均数的方法计算平均数。加权算术平均数可以根据不同形式的变量数列来计算:
由单项数列计算算术平均数。
例:某厂有20个工人的日产量资料如下表:
表4- —— 1
日产量(件)
工人数(人)
总产量(件)
14
2
28
15
4
60
16
8
128
17
5
85
18
1
18
合计
20
319
计算工人的平均日产量,应先将各组工人的日产量与工人数相乘求出各组工人的产量,然后加总求得全部工人的总产量,并与工人数相比。具体计算方法如下:
若以 x代表各组标志值,
f代表各组单位数(各组标志值出现的次数),
代表算术平均数,
则加权算术平均数的计算公式为:
可见,加权算术平均数的大小,不仅受各组标志值大小的影响,而且还受各组次数多少的影响。次数多的标志值对平均数的影响大,次数少的标志值对平均数的影响小。各组标志值次数的多少对平均数具有权衡轻重的作用。因此,将各组单位数(次数)称为权数,将以上平均数的计算形式称为加权算术平均数。
当各个标志值的权数都完全相同时,权数就失去了权衡轻重的作用,这里,加权平均数就等于简单算术平均数。即
当时
则:
权数除用总体各组单位数即频数形式表示外,还可以用比重即频率形式表示。因此,便有第二种加权算术平均数,即以标志值乘以相应的频率。其公式如下:
现仍以上表的资料为例,用比重权数计算加权算术平均数。见表4-2。
表4 ——2
日产量(件)
x
工人数(人)
f
各组工人数所占比重
日产量×权数
14
2
15
4
16
8
17
5
18
1
合计
20
,与利用绝对权数计算的加权算术平均数完全相同。
由组距数列计算加权算术平均数。
根据组距数列计算加权算术平均数与根据单项数列计算加权算术平均数的方法基本相同。只是要先计算出各组的组中值,用以代替各组的标志值,然后计算加权算术平均数。例如表4-——3。
表4——3 某企业职工平均工资计算表
月工资(元)
组中值(元)x
工人数(人)f
工资总额(元)xf
800-900
850
6
5100
900-1000
950
10
9500
1000-1100
1050
20
21000
1100-1200
1150
10
11500
1200-1300
第四章 数据分布特征的描述 来自淘豆网m.daumloan.com转载请标明出处.