§1. 基本原理
判别分析的目的是得到体现分类的函数关系式,即判别函数。基本思想是在已知观测对象的分类和特征变量值的前提下,从中筛选出能提供较多信息的变量,并建立判别函数;目标是使得到的判别函数在对观测量进行判别其所属类别时的错判率最小。
判别函数的一般形式是:
其中,
为判别函数判别值;
为反映研究对象
特征的变量;
为各变量的系数,即判别系数。
常用的判别法有距离判别法、Fisher判别法和Bayes判别法。
例1 人文发展指数是联合国开发计划署于1990年5月发表的第一份《人类发展报告》中公布的。该报告建议,目前对人文发展的衡量应当以人生的三大要素为重点,衡量人生三大要素的指示分别采用出生时的预期寿命、成人识字率和实际人均GDP,将以上三个指示指标的数值合成为一个复合指数,即为人文发展指数。资料来源UNDP《人类发展报告》1995年。
今从1995年世界各、中等发展水平的国家各五个作为两组样品,另选四个国家作为待判样品作判别分析。
使用三种判别方法进行判别,并进行研究三者之间的关系。
本例中变量个数p=3,两类总体各有5个样品,即n1=n2=5 ,有4个待判样品,假定两总体协差阵相等。
两组线性判别的计算过程如下:
(1)计算两类样本均值
(2)计算样本协差阵,从而求出
类似地
经计算
(3)求线性判别函数W(X)
解线性方程组
得
(4)对已知类别的样品判别分类
对已知类别的样品(通常称为训练样品)用线性判别函数进行判别归类,结果如下表,全部判对。
(5)对判别效果作检验
判别分析是假设两组样品取自不同总体,如果两个总体的均值向量在统计上差异不显著,作判别分析意义就不大:所谓判别效果的检验就是检验两个正态总体的均值向量是否相等,取检验的统计量为:
其中
将上边计算结果代人统计量后可得:
函数有效。
故在
检验水平下,两总体间差异显著,即判别
(6)对待判样品判别归类结果如下表:
2、继续用前面距离判别法例1的人文发展指数的数据作Bayes判别分析。
这里组数k=2,指标数p=3,n1=n2=5
代人判别函数:
判别分析的spss操作 来自淘豆网m.daumloan.com转载请标明出处.