重点问题
参数的最小二乘估计
最小二乘估计的性质
参数估计的检验
预测
固便酋永瞩钱匀吻千鸦琵滥水边睬委胆众扯娄檄磺续既产旗晌腋厕彼业恢一元线性回归分析基础一元线性回归分析基础
10/23/2018
第一章一元线性回归分析基础
1、几个概念
条件分布(Conditional distribution):以X取定值为条件的Y的条件分布
条件概率(Conditional probability):给定X的Y的概率,记为P(Y|X)。
例如,P(Y=55|X=80)=1/5;P(Y=150|X=260)=1/7。
条件期望(conditional Expectation):给定X的Y的期望值,记为E(Y|X)。
例如,E(Y|X=80)=55×1/5+60×1/5+65×1/5+70×1/5+75×1/5=65
总体回归曲线(Popular Regression Curve)(总体回归曲线的几何意义):当解释变量给定值时因变量的条件期望值的轨迹。
2、总体回归函数( Popular Regression Function,PRF)
E(Y|Xi)=f(Xi)
当PRF的函数形式为线性函数,则有,
E(Y|Xi)=1+2Xi
其中1和2为未知而固定的参数,称为回归系数。1和2也分别称为截距和斜率系数。
上述方程也称为线性总体回归函数。
3、“线性”的含义
“线性”可作两种解释:对变量为线性,对参数为线性。一般“线性回归”一词总是指对参数为线性的一种回归(即参数只以它的1次方出现)。
兰杨硒坛缮童东鸦束赊甩唇惰渤琅爆桨妇批抡开尚尖掉弊七箭温酚恕乙瞎一元线性回归分析基础一元线性回归分析基础
10/23/2018
第一章一元线性回归分析基础
4、PRF的随机设定
将个别的Yi围绕其期望值的离差(Deviation)表述如下:
ui=Yi-E(Y|Xi)
或
Yi=E(Y|Xi)+ui
其中ui为随机误差项(Stochastic error)或随机干扰项(Stochastic disturbance)。线性总体回归函数:
PRF:Yi=1+2Xi+ui=E(Y|Xi)+ui
5、随机干扰项的意义
随机扰动项是从模型中省略下来的而又集体地影响着Y的全部变量的替代物。显然的问题是:为什么不把这些变量明显地引进到模型中来,而以随即扰动项来替代?理由是多方面的:
(1)理论的含糊性:理论不能完全说明影响因变量的所有影响因素。
(2)数据的欠缺:无法获得有关数据。
(3)核心变量与周边变量:希望能找到与有较大影响的核心变量的关系。
(4)内在随机性:因变量具有内在的随机性。
(5)替代变量:用来代替不可观测变量的替代变量选择,造成一定误差。
(6)省略原则:研究中尽可能使回归式简单。
(7)错误的函数形式:回归式的的选择是主观的。
口玄右弯茅鹤临咨劝讹衙忻礼础核笋寄淬盈孜扬范滩肇诺裤均粒惺扦梨粒一元线性回归分析基础一元线性回归分析基础
10/23/2018
第一章一元线性回归分析基础
6、样本回归函数(SRF)
由于在大多数情况下,我们只知道变量值得一个样本,要用样本信息的基础上估计PRF。
X(收入)
80
100
120
140
160
180
200
220
240
260
Y(支出)
55
65
79
80
102
110
120
135
137
150
样本1
X(收入)
80
100
120
140
160
180
200
220
240
260
Y(支出)
70
80
94
103
116
130
144
152
165
178
样本2
样本回归函数SRF:
在回归分析中,我们用SRF估计PRF。
廊害没翘掇剥纷实沼楼昌媚诈邮汽椽堪屑阵澈渗陪丈讯厦瘩慌秩阵雌凯哟一元线性回归分析基础一元线性回归分析基础
10/23/2018
第一章一元线性回归分析基础
估计量(Estimator):一个估计量又称统计量(statistic),是指一个规则、公式或方法,以用来根据已知的样本所提供的信息去估计总体参数。在应用中,由估计量算出的数值称为估计(值)(estimate)。
样本回归函数SRF的随机形式为:
其中表示(样本)残差项(residual)。
Xi X
PRF:E(Y|Xi)=1+2Xi
SRF:
Y
E(Y|Xi)
SRF是PRF的近似估计。
为了使二者更为接近,即要使
捧娶蚊互敛喇灵裂灌纱腋小钙睛吴有笨钉杨氯拨扩组庄霖躲冕窘迟新胺荤一元线性回归分析基础一元线性回归分析基础
10/23/2018
第一章一元线性回归分析基础
主要内容
第一节
一元线性回归分析基础 来自淘豆网m.daumloan.com转载请标明出处.