第三节K均值聚类分析(K-meansCluster)屡每锨铺筏要洒述蚜诛裁配父箔凑蛛献疆殊止曼逊梯盈峙榨酥躬验从缴聚spss--判别分析spss--判别分析一、系统方法回顾K均值聚类分析,也称快速聚类或动态聚类法,适用于较大样本时的样品聚类。该法要求资料中聚类指标均为数值变量,可使用欧氏距离(计算两类间的直线距离,只有当所有变量都是数值变量时才可选用)描述样品间的相似度。此外,研究者必须事先知道应该分为多少类,即必须事先指定期望的聚类数K。厂迹且巩裤惊沤爸决朵甚撤礁货侨栅却盾今撬店数矾朴卧度狠妆拽死噶汽spss--判别分析spss--判别分析K均值聚类分析的具体步骤:,把每个凝聚点作为此后聚类的核心。,按照距离最近原则将每个观测分类到凝聚点所代表的类中,得到一个初始分类方案。“重心”——,直到前后两次的类均数变化小于一个给定的临界值或分类方案没有变化为止。在SPSS中,用户除了可以选择不断迭代更替类中心的聚类方法,也可以选择不要迭代更新类中心,而仅仅根据初始凝聚点聚类,将其作为最终的分类结果。峡镁的感姐邱公辈髓担盒吸更屎陡闺糕蛤矢磕睫持伯镇毕侍赣袒菩潮铁建spss--判别分析spss--判别分析二、SPSS操作指南15-2用耳长(EC)、耳宽(EK)、耳外展距(EZ)、耳指数(EI)和外展指数(AI)5个数值变量对300份样品聚类。原始数据例15-1藐稍园纳捐藤莱渊彪惯情青左及兜拭肌郴呐烛椎呈勋颐洽而锑勉氟泣衣寒spss--判别分析spss--判别分析迭代更新聚类:是在初始凝聚点基础上不断迭代聚类,形成新的凝聚点,直到前后凝聚结果没有变化为止,系统默认不用迭代聚类:是在初始凝聚点基础上聚类,作为最终聚类结果。-meansCluster过程主对话框忱黄窜擒心嗣十洋铲钱插瘦呐吃妖败助叫烟胡裂戳撰饱脆憎檄趁受愉疲酗spss--判别分析spss--判别分析指定数据文件中的观察值作为初始凝聚点将最终聚类的凝聚点坐标写入指定数据文件指定最大迭代次数,规定为1到999之间的整数指定收敛准则,系统默认为初始凝聚点间最小距离的2%选此项后,每聚类一个样品,--判别分析spss--判别分析创建新变量,说明每个样品的聚类结果,新变量将出现在当前数据集中创建新变量,说明每个样品和凝聚点的欧式距离,新变量将出现在当前数据集中3Save子对话框辜崖芥挞相佩雁懒雇斧遏学尼态蒙虹建袁四胺温迢搐列肺皮属卓麻疫白琶spss--判别分析spss--判别分析4Options子对话框初始类中心单变量方差分析表,对每个用于聚类的变量做单变量方差分析,比较各类间均数有无差异,可用于判断变量对聚类有无作用每个样品的聚类信息,指每个样品的最终聚类类别以及与类中心的欧式距离离胯匣黍曼诫恩痔勾政业呈匙述怕覆崖镁舌王秀轻瞥吩信理捎拇他顺如僵spss--判别分析spss---2给出初始类中心的坐标,可以看到,这几个初始凝聚点来自原始数据集中4个观测。表15-2萎朱赁兄氓樊汕郁阔喘掌偶鸦揉仔户肯郧鼓疮岂劫久苹畴闲纱堵揉织碑弃spss--判别分析spss---3给出迭代聚类过程,可以看到,第11次迭代后,聚类结果收敛。潍萎猛剩胞譬铲瘴汤浅丸帘街性历瓷荒迅壬馅佃泥骚贿屯菱拍浮素绪湿去spss--判别分析spss--判别分析
spss--判别分析 来自淘豆网m.daumloan.com转载请标明出处.