现实世界中,变量之间相互依赖、相互制约的关系,可大致分为两类:一类是函数关系,即变量之间存在着确定的关系。例如圆半径与圆面积的关系是
回归分析模型
另一类是相关关系。例如消费者对某种商品的月需求量与该种商品的价格的关系。又如农作物的单位面积产量与降雨量、施肥量等的关系。这类关系不能用函数来表达。变量之间的这种非确定性关系,称为相关关系。
对于相关关系,虽然不能求出变量之间精确的函数关系式,但是通过大量的观测数据,可以发现它们之间存在着一定的统计规律性。
由一个(或一组)非随机变量来估计或预测某一个随机变量的观测值时,所建立的数学模型和所进行的统计分析,称为回归分析。如果这个模型是线性的,就称为线性回归分析。研究两个变量间的相关关系的回归分析,称为一元回归分析。
在一元回归分析里,我们要考察的是随机变量与非随机变量之间的相互关系。虽然和之间没有确定的函数关系。但是我们可以借助函数关系来表达它们之间的统计规律性。用以近似地描述具有相关关系的变量间的联系的函数,称为回归函数。
由于与之间不存在完全确定的函数关系,因此必须把随机波动产生的影响考虑在内。于是有一元线性回归模型的一般形式为
其中是固定的未知参数,也称为回归系数,自变量是非随机可精确观测的, 是均值为0,方差为的随机变量,在模型中它代表其他随机因素对Y产生的影响。
一元线性回归分析的主要任务是用样本值对回归系数和作点估计;对作假设检验;在处对作预测,并对作区间估计。
记,则,称为对的回归直线方程。
的无偏估计为
残差平方和
参数的置信水平为的置信区间为
参数的置信水平为的置信区间为
参数的置信水平为的置信区间为
用的回归值作为的预测值,同时的置信水平为的预测区间为
. 多元线性回归模型
有多个自变量的线性回归模型称为多元线性回归模型。假定是一个可以观测的随机变量, 为k个自变量,且有
现假定对于变量与自变量已得到n组观测数据如下:
回归分析模型 来自淘豆网m.daumloan.com转载请标明出处.