第十章回归分析
第一节回归分析的概述
第二节参数估计
第三节假设检验
第四节预测与控制
第五节非线性回归的线性化处理
第一节回归分析的概述
一个过程中多个变量之间的关系分为两类:
确定性关系,也就是通常所说的函数关系;
非确定性关系,即所谓的相关关系。
确定性关系是指当一些变量的值确定以后另一些变量的值也随之完全确定的关系。
相关关系是指变量之间有一定的依赖关系,但当一些变量的值确定以后,另一些变量的值虽随之变化却并不能完全确定,这时变量间的关系不能精确地用函数来表示。
上一页
下一页
返回
(1) 给出建立具有相关关系的变量之间的数学关系式(通常称为经验公式)的一般方法;
(2) 判别所建立的经验公式是否有效;判别哪些预报变量对响应变量的影响是显著的,哪些是不显著的;
(3)利用所得到的经验公式进行预测和控制。
回归分析(regression analysis)是数理统计中研究一个响应变量与若干个预报变量之间相关关系的一种有效方法;其中只有一个预报变量的回归分析称为一元回归分析,多于一个预报变量的回归分析称为多元回归分析。
回归分析的任务主要有三个:
上一页
下一页
返回
一元回归分析与最小二乘法
取定x时随机变量y的数学期望E(y|x)作为x时随机变量y的估计值,即
显然,当x变化时E(Y|X=x)是x的函数,记作
可以用一个确定的函数关系式
大致地描述y与x之间的相关关系。
函数称为y关于x的回归函数,简称回归;
称为y关于x的回归方程。
上一页
下一页
返回
回归方程反映了y的数学期望E(y)随x的变化而变化的规律性。y与x的相关关系表示为
是随机误差,它是均值为零的随机变量,
通常假定是不依赖于X的未知参数。
的大小在一定程度上反映了在x处随机变量y的观测值的大小,如能找到,就能在一定条件下解决如下两个问题:,估计当x取某一定值时y的取值情况,这就是所谓的预测问题;,控制X的取值范围以使y在给定的范围内取值,这就是所谓的控制问题。
上一页
下一页
返回
通常先限制为某一类型的函数。函数的类型可以由与被研究问题的本质有关的物理假设来确定;若没有任何理由可以确定函数的类型,则只能根据在试验结果中得到的散点图来确定。
在确定了函数的类型后,就可以设
其中a1, a2…… ak为未知参数。
寻找合适的回归函数的问题就归结为:如何根据试验数据合理地选择参数a1, a2…… ak的估计值
上一页
下一页
返回
这些估计值使得方程在一定的
意义下“最佳地”表现变量Y与X之间的相关关系。
选取中参数,使得观测值yi与相应的函数值(i=1,2……n)的偏差平方和为最小,这就是所谓的最小二乘法。
最小二乘法的概率意义:设当可控变量X取任意实数x时,随机变量Y服从正态分布,即Y的概率密度为
其中,而是不依赖于x的常数。
上一页
下一页
返回
在n次独立试验中得到观测值(x1,y1),(x2,y2),…
(xn,yn),利用极大似然估计法估计未知参数a1, a2,… ak,时,有似然函数
似然函数L取得极大值,上式指数中的平方和
取最小值。
即为了使观测值(xi , yi)(i=1,2,…,n)出现的可能性最大,应当选择参数a1,a2,…,ak,使得观测值yi与相应的函数值
的偏差平方和最小。这就是最小二乘法的概率意义。
上一页
下一页
返回
解方程组求出参数a1,a2,……ak的估计值(这样求出的参数a1,a2,……ak的估计,称为最小二乘估计(least squares estimation ,简称LSE)),再求回归方程的估计式(称为经验回归方程)。
分别求S对a1,a2,……ak的偏导数,并令它们等于零,就得到
上一页
下一页
返回
1、一元线性回归
回归方程为
方程的图形称为回归直线。
x,y的相关关系可表示为
其中a, b, 2为不依赖于x的未知参数,上式称为一元线性回归模型,简称一元线性模型。当y与x间满足这种关系时,y与x间有线性相关关系。
考虑回归函数是线性函数,即,这就是所谓的一元线性回归分析。
回归方程为
第二节参数估计
上一页
下一页
返回
线性代数之回归分析 来自淘豆网m.daumloan.com转载请标明出处.