2018/5/17
1
第三章数据分布特征的描述
集中趋势的度量
离散程度的度量
偏态与峰态的度量
2018/5/17
2
什么是集中趋势(central tendency)
一组数据向其中心值靠拢的倾向和程度
测度集中趋势就是寻找数据水平的代表值或中心值
不同类型的数据用不同的集中趋势测度值
注意:低层次数据的测度方法也适用于高层次的数据,但高层次数据的测度方法往往不适用于低层次的数据。
2018/5/17
3
分类数据---众数
一组数据中出现次数最多的变量值
适合于数据量较多时使用
不受极端值的影响
一组数据可能没有众数或有几个众数
主要用于分类数据,也可用于顺序数据和数值型数据
2018/5/17
4
众数(不惟一性)
无众数原始数据: 10 5 9 12 6 8
一个众数原始数据: 6 5 9 8 5 5
多于一个众数原始数据: 25 28 28 36 42 42
5
有时众数是一个合适的代表值
比如在服装行业中,生产商、批发商和零售商在做有关生产或存货的决策时,更感兴趣的是最普遍的尺寸而不是平均尺寸。
2018/5/17
6
1、分类数据的众数 (例题分析)
不同品牌饮料的频数分布
饮料品牌
频数
比例
百分比(%)
可口可乐
旭日升冰茶
百事可乐
汇源果汁
露露
15
11
9
6
9
30
22
18
12
18
合计
50
1
100
解:这里的变量为“饮料品牌”,这是个分类变量,不同类型的饮料就是变量值
所调查的50人中,购买可口可乐的人数最多,为15人,占总被调查人数的30%,因此众数为“可口可乐”这一品牌,即
Mo=可口可乐
2018/5/17
7
2、顺序数据的众数 (例题分析)
解:这里的数据为顺序数据。变量为“回答类别”
甲城市中对住房表示不满意的户数最多,为108户,因此众数为“不满意”这一类别,即
Mo=不满意
甲城市家庭对住房状况评价的频数分布
回答类别
甲城市
户数(户)
百分比(%)
非常不满意
不满意
一般
满意
非常满意
24
108
93
45
30
8
36
31
15
10
合计
300
2018/5/17
8
3、数值型数据的众数
1)单变量值分组数据
某年级83名女生身高资料
身高人数
(CM) (人)
152 1
154 2
155 2
156 4
157 1
158 2
159 2
160 12
161 7
162 8
163 4
身高人数
(CM) (人)
164 3
165 8
166 5
167 3
168 7
169 1
170 5
171 2
172 3
174 1
总计 83
STAT
2018/5/17
9
2)组距分组数据众数的计算公式
2018/5/17
10
G
E
F
D
C
A
B
f
X
f3
f2
f1
d
L
U
M0
Δ1
Δ2
众数的计算公式可以从几何图形得到证明:
统计数据的描述 来自淘豆网m.daumloan.com转载请标明出处.