第一节判别分析方法第二节以直线划分的判别法第三节以曲线划分的判别法第四节费歇尔判别法第五节逐步判别法判别分析第一节判别分析方法?分类: ?1、按判别的组数来分,有两组判别分析和多组判别分析?2、按区分不同总体所用的数学模型来分, 有线性判别和非线性判别?3、按判别对所处理的变量方法不同有逐步判别、序贯判别。?4、按判别准则来分,有费歇尔判别准则、贝叶斯判别准则?判别分析是根据观察或测量到若干变量值,判断研究对象如何分类的方法。实际上是根据表明事物特点的变量值和它们所属的类求出判别函数,根据判别函数对未知所属类别的事物进行分类的一种分析方法。第二节以直线划分的判别法?一、判别的基本思想?把观测到的 n个样本看作 p维空间的 n个点,以某种方法将 p维空间划分为互不相交的 q个区域, 每个区域对应着一个类,对于给定的新样本点, 必然要落入其中某个类中。?对于满足类内样本点接近、类间样本点疏远的性质,可以通过统计量来表现。?比值越大说明类与类间差异越大,分类效果越好类内离差平方和类间离差平方和?二、两个类别的判别?步骤: ?1、计算两类( A,B) 各自的均值?2、计算类内离差平方和与类间离差平方和?3、求出判别函数?4、计算待判样本的三个值 y, , ?5、判断先建立判别临界值 y 0,在两总体先验概率相等的假设下,一般常取如果,则判定准则为: y>y 0,x属于 A组; y<y 0,x 属于B组如果,则判定准则为: y>y 0,x属于 B组; y<y 0, x属于 A组)(ay)(by 21 210)()(nn BynAyny???)()(ByAy?)()(ByAy??例1:为研究某地区育龄妇女的生育状况, 根据生育峰值年龄,一胎生育率,二胎生育率、多胎生育率及总和生育率 5项指标,将 12个已知样本点分为两组,根据已知样本建立判别函数,并判定另外 3个待判个体属于何组。数据见 spssex /ex601 5008 .23544 .12 117 .41035 .1xxxxy??????三、三个类别情形的判别?1、三条线都有通过所有点的重心?2、三条线相交组成一个三角形第三节以曲线划分的判别法?一、判别原理?马氏距离: ?判别函数: ?判别原则: ?二、马氏距离导出的二次曲线判别 2 1 1 )]() [()( jiji ijxxsxxMd?????))(())((),( 1 2kxxskxxzzkxd k????????,根据抽样调查资料进行分类, 共抽取 28个省、市、自治区的六个指标数据。先采用聚类分析,将 28个省、市、自治区分为三组,其中北京、上海、广州3个城市属于孤立样本单位,未归属于已分的三组中,现采用曲线判别法来判定北京、上海、广州归属于哪个组。原始数据见 spssex /ex603 第四节费歇尔判别法?费歇尔判别方法是历史上最早提出的判别方法之一,也叫线性判别法?费歇尔判别的思想是通过将多维数据投影到某个方向上,投影的原则是将类与类之间尽可能的分开,然后再选择合适的判别准则,将待判的样本进行分类判别。
第一节 判别分析方法 第二节 以直线划分的判别法 第三节 以曲线划分的判别法 第四节 费歇尔判别法.ppt 来自淘豆网m.daumloan.com转载请标明出处.