第八章线性相关前面着重于描述某一变量的统计特征或比较该变量的组间差别两个随机变量之间的关系:如体重与肺活量、年龄与血压是否存在线性联系?正向还是负向?联系的程度?线性相关(linearcorrelation):线性联系?方向?程度?。样本:独立的、成对的观察值(x1,y1),(x2,y2),…,(xn,yn),南方某地在应届中学毕业生花名册中随机抽取20名男生,分别测量他们和他们的父亲的身高(cm),。(cm)数据编号**********父高X150153155158161164165167168169子高Y159157163166169170169167169170编号11121314151617181920父高X170171172174175177178181183185子高Y173170170176178174173178176180问如何保证这是一份可供讨论线性相关的合格样本?解(1)随机抽取;(2)互相独立?散点图(scatterplot)座标轴:分别表示两个变量;n个点:构成一幅散点图()(a)和(c),正相关(positivecorrelation)图(b)和(d),负相关(negativecorrelation)图(e)、(f)、(g),Y和X无关联图(h),可能存在曲线型联系。通常所说的相关就是线性相关,(e)到(h)均属不相关对于不相关的情形,(product-momentcorrelationcoefficient)对双变量正态分布变量X和Y ()总体相关系数,记为rr=0,X和Y无线性相关或零相关(nullcorrelaton)r>0,正相关r<0,负相关r=1或-1,完全相关(罕见!)。样本相关系数,记为r对于n对随机样本,X和Y的样本协方差: ()lxy:X与Y的离均差乘积和若所有离均差乘积平均后接近零,则表明部份个体的X和Y同方向,部份个体的X和Y反方向,总的说来,诸个体各循其道,杂乱无章相反,若离均差乘积平均后为正,且距零较远,则表明多数个体的X和Y同方向,即正相关;若离均差乘积平均后为负,且距零较远,则表明多数个体的X和Y反方向,即负相关。协方差的大小与X,Y的取值单位有关,不同问题中的协方差不可比较。相关系数:X和Y分别标准化之后的协方差。数值介于-1和+1之间,且没有单位()lxx:X的离均差平方和lyy:(假定系独立随机双正态样本)。解=3376,=3407,n=20=571728,=581081,=576161由()式得到, 。样本相关系数也存在变异性。得到线性相关的描述统计量r之后,还有必要对其所来自的总体进行统计推断。相关系数的假设检验H0:r=0直接查r界值表或t检验: v=n-2 () ()Sr:样本相关系数r的标准差(也称标准误)。=,试检验相关是否具有统计学意义。解(1),18=,|r|>,18,P<,(2)t检验H0:r=0,H1:r≠0,a=。查t分布表,,18=。显然|tr|>,P<。故拒绝H0,接受H1,可以认为父子身高之间存在正相关关系。与查表结论相同。相关系数的区间估计(1)对样本相关系数r作变换或()(tanh为双曲正切函数,tanh-1为反双曲正切函数)
线性计算方法 来自淘豆网m.daumloan.com转载请标明出处.