精品课程
《统计基础》
经济管理系课题组
版权所有:马如武王桂芳
第5章数据分布特征的描述
【学习目标】
本章主要介绍了数据分布特征的描述的基本理论,包括平均指标和变异指标的基本概念、种类以及各种计算方法,计算和应用平均指标应注意的问题等。通过学习,使学习者能够掌握数据分布的集中趋势和离散特征,为经济管理服务。
【学习要求】
通过本章的学均指标和变异指标的基本概念,熟练掌握各种计算方法,明确计算和运用平均指标应注意的问题等等。
【学习内容】
统计数据分布的特征,可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度,如算术平均数;二是分布的离中趋势,反映各数据远离其中心值的程度,如标准差;三是分布的偏态和峰度,反映数据分布的形状。这三个方面分别反映了数据分布特征的不同侧面,第一、二方面是主要的。本章重点讨论第一、第二两方面代表值的计算方法、特点及其应用场合。
集中趋势——数值平均数
集中趋势是指一组数据向其中心值靠拢的倾向,测度集中趋势也就是寻找数据一般水平的代表值或中心值。取得集中趋势代表值的方法通常有两种:一是从总体各单位变量值中抽象出具有一般水平的量,这个量不是各个单位的具体变量值,但又要反映总体各单位的一般水平,这种平均数称为数值平均数。数值平均数有算术平均数、调和平均数、几何平均数等形式。二是先将总体各单位的变量值按一定顺序排列,然后取某一位置的变量值来反映总体各单位的一般水平,把这个特殊位置上的数值看作是平均数,称作位置平均数。位置平均数有众数、中位数、四分位数等形式。
算术平均数,是集中趋势测度中最重要的一种,它是所有平均数中应用最广泛的平均数。
算术平均数=
1. 简单算术平均数(Simple Arithmetic Mean)
根据未经分组整理的原始数据计算的均值。设一组数据为x1,x1,…xn,则简单算术平均数的计算公式如下:
例5–1 据南方人才服务中心调查,从事IT行业的从业人员年薪在40000-55000元之间,表5–1的数据是IT从业人员年薪的一个样本:
计算IT从业人员的平均年薪。
根据公式计算如下:
2. 加权算术平均数(Weighted Arithmetic Mean)
根据分组整理的数据计算的算术平均数。其计算公式为:
(5–2)
式中:f 代表各组变量值出现的频数。
例5–2 以表5–2为例,计算人均日产量。计算表见表5–2。
平均日产量=
3. 算术平均数性质
算术平均数在统计学中具有重要的地位,它是进行统计分析和统计推断的基础。首先,从统计思想上看,它是一组数据的重心所在,是数据误差相互抵消后的必然性结果
其次,它具有下面一些重要的数学性质,这些数学性质在实际工作中有着广泛的应用(如在相关性分析和方差分析及建立回归方程中),同时也体现了算术平均数的统计思想。
,即
∑= 0;
,即
∑=min。
4. 利用计算工具求算术平均数
(1)利用计算器计算
对于未整理的原始数据或已整理分组的数列,均可利用计算器的统计功能计算算术平均数。需要特别注意的是,当资料为变量数列时,一定要遵循以下输入顺序:先输入变量值,然后输入乘号键,接下来输入频数值,绝对不能颠倒次序。
(2)利用计算机计算
运用计算机技术,不但能使人们从大量繁杂的手工处理数据的工作中解脱出来,而且还可能大大提高对统计数据的利用率。虽然功能强大的统计软件包在一般人使用的电脑上没有安装,但使用“office”软件的用户超过90%,而用“office”软件中的“excel”组件足可以及时、准确、完整地将有关统计常用的基本统计量(如本章的算术平均数)等迅速提供给人们。
下面举一个简单的例子说明利用“excel”计算算术平均数的步骤。如,计算某班上学期期末考试各科平均成绩。
方法一:
第一步打开“excel”,输入全班每位同学各科考试成绩(一般以每行记录一名学生的各科成绩,也可以每列记录一名学生的各科成绩);
第二步选择(单击)“工具”下拉菜单;
第三步选择(单击)“数据分析”选项;
第四步从弹出的“分析工具”中选择(单击)“描述统计”并单击“确定”;
第五步在对话框中的“输入区域”框内键入要计算的单元格区域(如果包括字段行,则须选中“标志位于第一行”复选框。若分组方式为逐行,则该复选框选定标志位于第一列);在“输出选项”中选择输出区域;选择“汇总统计”(该选项给出全部描述统计量);单击“确定”。
方法二:
第一步打开“excel”,输入全班每位同学各科考试成绩(一般以每行记录一名学生的各科成绩,也可以每列记
第5章 数据分布特征的描述 来自淘豆网m.daumloan.com转载请标明出处.