1
应用多元统计分析
第五章判别分析
有时需要建立一种规则,需要你根据看到性状,来判别个体的属性或类别
比如让你根据人的某些外在特征判别人的年龄组(老中青)或民族
你可能说这很容易,你的判别依据是什么?
如果这活让计算机来完成呢?
可能很困难,即使让计算机判断人的性别也比较困难。
2
3
第五章判别分析什么是判别分析
在气象学中,由气象资料判断明天是阴天还是晴天, 是有雨还是无雨.
在市场预测中,由调查资料判断下季度(或下个月)产品是畅销、平常或滞销.
在环境科学中,由气象条件,污染浓度等判断该地区是属严重污染,一般污染还是无污染.
在地质勘探中,由岩石标本的多种特征判断地层的地质年代,是有矿还是无矿,是富矿还是贫矿.
在体育运动中,由运动员的多项运动指标来判定游泳运动员的"苗子"是适合练蛙泳,仰泳还是自由泳等
样本数据
4
xi1,xi2,…,xin表示个体性状
yi表示个体类别,取有限个值。
判别分析的目的
根据样本数据建立模型
y=f(x1,x2,…,xm)
根据这个模型对未来个体的类别进行判别
使得预测的准确率较高
判别的思想就是看一个样品和那个类长得比较“象”,和哪个类“象”就判别为哪一类。
但是“象”与“不象”,确是仁者见仁,智者见智。不同的人来说,结果可不完全相同。
但是还是能认同“较为合理”的结果。
5
6
第五章判别分析
§ 距离判别
§ Bayes(贝叶斯)判别法及
广义平方距离判别法
§ Fisher(费歇)判别
§ 判别效果的检验及
各变量判别能力的检验
§ 逐步判别
7
距离判别的基本思想是:
样品和哪个总体距离最近,就判它属哪个总体.
距离判别也称为直观判别法.
我们在具体讨论距离判别法之前,应给出合理的距离的定义.
8
马氏距离
已知有两个类G1和G2,比如G1是设备A生产的产品,(如考察指标为耐磨度X),其平均耐磨度μ1=80,反映设备精度的方差σ2(1)=;设备B的产品质量稍差,其平均耐磨度μ2=75,反映设备精度的方差σ2(2)=,测得耐磨度x0=78,试判断该产品是哪一台设备生产的?
直观地看, x0 与μ1(设备A)的绝对距离近些,按距离最近的原则是否应把该产品X0 判断为设备A生产的?
9
,
G2的相对平方距离为d21(x0)或d22(x0),则:
d21(x0)= = = 16=42
d22(x0)= = ==
因为d2(x0)=<4= d1(x0) ,按这种距离准则应判X0为设备B生产的.
(x0 -μ1)2
σ2(1)
(78 - 80)2
(x0 -μ2)2
σ2(2)
(78 - 75)2
4
10
设备B生产的产品质量较分散,出现x0为78的可能性仍较大;
而设备A生产的产品质量较集中,出现x0为78的可能性较小.
判X0为设备B的产品更合理.
这种相对于分散性的距离就是本节介绍的马氏距离.
判别分析 第一节 来自淘豆网m.daumloan.com转载请标明出处.