回归分析
1、我们将用于估计值的线性函数作为确定性函数;
的实际值与估计值之间的误差记为,称之为随机误差;
将称为线性回归模型.
说明:(1)产生随机误差的主要原因有:
①所用的确定性函数不恰当引起的误差;
②忽略了某些因素的影响;
③存在观测误差.
(2)对于线性回归模型,我们应该考虑下面两个问题:
①模型是否合理(这个问题在下一节课解决);
②在模型合理的情况下,如何估计,?
2、最小二乘法求参数估计值
利用最小二乘法可以得到,的计算公式为
,
其中,
由此得到的直线就称为这对数据的回归直线,,分别为,的估计值,称为回归截距,称为回归系数,称为回归值.
3. 线性回归方程中,的意义是:以为基数,每增加1个单位,相应地平均增加个单位。
4、对任意给定的样本数据,由计算公式都可以求出相应的线性回归方程,但求得的线性回归方程未必有实际意义,所以需要对相关系数进行检验。.
相关系数的计算公式:
对于,随机取到的对数据,样本相关系数的计算公式为
.
5、相关系数的性质:
(1);
(2)越接近与1,,的线性相关程度越强(正相关和负相关)
(3)越接近与0,,的线性相关程度越弱.
可见,一条回归直线有多大的预测功能,和变量间的相关系数密切相关.
6、对相关系数进行显著性检验的步骤:
相关系数的绝对值与1接近到什么程度才表明利用线性回归模型比较合理呢?,在统计上有明确的检验方法,基本步骤是:
(1)提出统计假设:变量,不具有线性相关关系;
(2)如果以的把握作出推断,那么可以根据与(是样本容量)在附录(教材P111)中查出一个的临界值(其中称为检验水平);
(3)计算样本相关系数;
(4)作出统计推断:若,则否定,表明有的把握认为变量与之间具有线性相关关系;若,则没有理由拒绝,即就目前数据而言,没有充分理由认为变量与之间具有线性相关关系.
说明:1)对相关系数进行显著性
回归分析OK 来自淘豆网m.daumloan.com转载请标明出处.