多元分析
研究多个自变量与因变量相互关系的一组统计理论和方法。又称多变量分析。多元分析是单变量统计方法的发展和推广。人的心理和行为具有复杂的内在结构,受到多种因素的制约。仅采用单变量分析难以揭示其内在结构以及各种影响因素的主次作用和交互影计算两两之间的某种“距离”,找出距离最近的两个类、合并为一个新类。然后逐步重复这一过程,直到并为k类为止。另一种为逐步聚类或称动态聚类方法。当样本数很大时,先将n个样本大致分为k类,然后按照某种最优原则逐步修改,直到分类比较合理为止。
聚类分析是依据个体或变量的数量关系来分类,客观性较强,但各种聚类方法都只能在某种条件下达到局部最优,聚类的最终结果是否成立,尚需专家的鉴定。必要时可以比较几种不同的方法,选择一种比较符合专业要求的分类结果。
主成分分析把原来多个指标化为少数几个互不相关的综合指标的一种统计方法。例如,用p个指标观测样本,如何从这p个指标的数据出发分析样本或总体的主要性质呢?如果p个指标互不相关,则可把问题化为p个单指标来处理。但大多时候p个指标之间存在着相关。此时可运用主成分分析寻求这些指标的互不相关的线性函数,使原有的多个指标的变化能由这些线性函数的变化来解释。这些线性函数称为原有指标的主成分,或称主分量。
主成分分析有助于分辨出影响因变量的主要因素,也可应用于其他多元分析方法,例如在分辨出主成分之后再对这些主成分进行回归分析、判别分析和典型相关分析。主成分分析还可以作为因素分析的第一步,向前推进就是因素分析。其缺点是只涉及一组变量之间的相互依赖关系,若要讨论两组变量之间的相互关系则须运用典型相关。
典型相关分析先将较多变量转化为少数几个典型变量,再通过其间的典型相关系数来综合描述两组多元随机变量之间关系的统计方法。设X是p元随机变量,y是q元随机变量,如何描述它们之间的相关程度?当然可逐一计算x的p个分量和y的q个分量之间的相关系数(pxq个),但这样既繁琐又不能反映事物的本质。如果运用典型相关分析,其基本程序是,从两组变量各自的线性函数中各抽取一个组成一对,它们应是相关系数达到最大值的一对,称为第
1对典型变量,类似地还可以求出第2对、第3对、……,这些成对变量之间互不相关,各对典型变量的相关系数称为典型相关系数。所得到的典型相关系数的数目不超过原两组变量中任何一组变量的数目。
典型相关分析有助于综合地描述两组变量之间的典型的相关关系。其条件是,两组变量都是连续变量,其资料都必须服从多元正态分布。
以上几种多元分析方法各有优点和局限性。每一种方法都有它特定的假设、条件和数据要求,例如正态性、线性和同方差等。因此在应用多元分析方法时,应在研究计划阶段确定理论框架,以决定收集何种数据、怎样收集和如何分析数据资料。
多变量分析
多变量分析为统计方法的一种,包含了许多的方法,最基本的为单变量,再延伸出来的多变量分析。
多变量统计分析(multivariatestatisticalanalysis)
统计资料中有多个变量(或称因素、指标)同时存在时的统计分析,是统计学的重要分支,是单变量统计的发展。例如对630名炊事员高血压病进行调查,检查项目中除血压外,尚有年龄、性别、体重、体胖等15个项目(变量)。如果用单变量统计分析法考察超重与血压的关系,一般是把数据做成表1的形式。从表1可见
多元分析 来自淘豆网m.daumloan.com转载请标明出处.