第二节数值变量资料的统计分析
——统计描述
Descriptive Statistics
信阳职业技术学院赵玉霞
一数值变量资料的频数表
二集中趋势指标
三离散程度指标
四正态分布及其应用
主要内容
学习目标
,频数分布的两种趋势;
(平均水平、离散程度) 的计算方法
,了解医学参考值范围的估计方法
编号
血清甘油三脂
编号
血清甘油三脂
1
…
…
2
153
3
154
4
155
5
156
6
157
7
158
8
159
…
…
160
表 160名正常成年女子的血清甘油三酯(mmol/L)
一、频数表(frequency table)
组段
划记
频数,f
~
3
~
正
9
~
正正
12
~
正正
13
~
正正正
17
~
正正正
18
~
正正正正
20
~
正正正
18
~
正正正
17
~
正正
13
~
正
9
~
正
8
~
合计
3
160
1. 频数表的编制
(1)求极差(range):即最大值与最小值之差,又称为全距。
本例极差: R=-=(mmol/L)
(2) 决定组数、组段和组距:根据研究目的和样本含量n确定。组距=极差/组数,通常分10-15个组,为方便计,组距参考极差的十分之一, 再略加调整。
本例i= R /10==≈。
(3) 列出组段:第一组段的下限略小于最小值,最后一个组段上限必须包含最大值,其它组段上限值忽略。
(4) 划记计数:用划记法将所有数据归纳到各组段,得到各组段的频数。
①集中趋势(central tendency):变量值集中位置。本例在组段“~”。
——平均水平指标
②离散趋势(tendency of dispersion):变量值围绕集中位置的分布情况。~,共有90人,占56%;离“中心”位置越远,频数越小;且围绕“中心”左右对称。
——变异水平指标
组段
频数,f
~
3
~
9
~
12
~
13
~
17
~
18
~
20
~
18
~
17
~
13
~
9
~
8
~
合计
3
160
1. 正态分布normal distribution (图2-1)( skewed to the right),也称正偏态(positive skewed)(图2-2)3. 右偏态( skewed to the left),也称负偏态(negative skewed)(图2-3)
.
计量资料频数分布与图示——正态分布
组段
频数,f
~
3
~
9
~
12
~
13
~
17
~
18
~
20
~
18
~
17
~
13
~
9
~
8
~
合计
3
160
中间高、两边低、左右对称
如果观察例数逐渐增多,组段不断分细,频数分布“中间高,两侧低”的特征会越来越明显
直方图顶端的连线就会逐渐形成一条高峰位于中央(均数所在处),两侧逐渐降低且左右对称,不与横轴相交的光滑曲线图“中间高、两边低、左右对称”
正偏态分布:
长尾向右延伸
负偏态分布:长尾向左延伸
计量资料频数分布与图示——偏态分布
总称为平均数(average)反映了资料的集中趋势( central tendency )。常用的有:
二集中趋势指标
算术均数
几何均数 G
中位数 M
第二节数值变量资料的统计分析-统计描述 来自淘豆网m.daumloan.com转载请标明出处.