第二章统计描述
Descriptive Statistics
第一节计量资料的统计描述
第二节正态分布
第三节 计数资料的统计描述
第四节统计表与统计图
本章结构
第一节计量资料的统计描述
频数表与频数分布
平均指标(算术均数、几何均数、中位数、众数)
变异指标(极差、百分位数与四分位间距、方差、标准差、变异系数)
一、频数表与频数分布 (frequency table and frequency distribution)
表2-1 160名正常成年女子的血清甘油三酯(mmol/L)
编号
血清甘油三脂
编号
血清甘油三脂
1
…
…
2
153
3
154
4
155
5
156
6
157
7
158
8
159
…
…
160
1. 频数表的编制步骤
(1)求极差(range):即最大值与最小值之差,又称为全距。
本例极差: R=-=(mmol/L)
(2) 决定组数、组段和组距:根据研究目的和样本含量n确定。组距=极差/组数,通常分10-15个组,为方便计,组距参考极差的十分之一, 再略加调整。
本例i= R /10==≈。
(3) 列出组段:第一组段的下限略小于最小值,最后一个组段上限必须包含最大值,其它组段上限值忽略。
(4) 划记计数:用划记法将所有数据归纳到各组段,得到各组段的频数。
组段
(1)
划记
(2)
频数,f
(3)
组中值,X
(4)
fX
(5)= (3)×(4)
~
3
~
正
9
~
正正
12
~
正正
13
~
正正正
17
~
正正正
18
~
正正正正
20
~
正正正
18
~
正正正
17
~
正正
13
~
正
9
~
正
8
~
合计
3
160
2. 频数表的分布特征
①集中趋势(central tendency):变量值集中位置。本例在组段“~”。
——平均水平指标
②离散趋势(tendency of dispersion):变量值围绕集中位置的分布情况。~,共有90人,占56%;离“中心”位置越远,频数越小;且围绕“中心”左右对称。
——变异水平指标
3. 正态分布与偏态分布
1. 表2-2频数表——正态分布normal distribution (图2-1)2. 表2-3频数表——右偏态( skewed to the right),也称正偏态(positive skewed)(图2-2)3. 表2-4频数表——左偏态( skewed to the left),也称负偏态(negative skewed)(图2-3)
正态分布:中间高、两边低、左右对称
正偏态分布:长尾向右延伸
负偏态分布:长尾向左延伸
统计学第二讲统计描述1 来自淘豆网m.daumloan.com转载请标明出处.