§ 含有虚拟变量的回归模型
前述变量均是用某种意义明确的尺度加以定量的变数。
暂时性影响:经济行为受特定因素的影响,因而促使一期或数期变数与其他各期有明显的差异。
虚拟变量:用来表现暂时性影响的变量,或者说,表明某种“品质”或属性是否存在的的变量。
(1)水平:当自变量以虚拟变量的形式出现时,虚拟变量的出现形式称为“水平”。
(2)反应:用表示第个样本第个自变量取第个水平的反应:
=
(3)反应表:将各样本的资料排列得到的表格称为反应表。
(4)反应矩阵:把反应表中的反应写成矩阵形式,称为反应矩阵。记为X=()。
(1)建模原则:
如果一个属性变数有m个类型,只引入m—1个虚拟变量。否则,会陷入所谓的虚拟变数陷阱之中,出现完全多重共线性的情况。
在解释采用虚拟变量的模型结果时,要弄清楚水平值是如何确定的。
指定取值为0的类型或组通常用来指明基础类型、控制类型、对比类型或被省略的类型。
附属于虚拟变量D的系数称为不同的截距系数,它说明D取值为1的那种类型的截距项与基础类型的截距系数的数值差异有多大。
(2)建立数学模型:将虚拟变量视为普通变量,建立回归模型。
(3)对参数作出估计。
(4)进行预测。
(5)一般情况:指模型自变量中同时含有虚拟变量和普通变量。
研究1958年第四季度到1971年第二季度期间英国的失业率和职务空缺率之间的关系。原始数据如下表:
id
un
v
d
dv
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
带虚拟变量的回归模型 来自淘豆网m.daumloan.com转载请标明出处.