-
. z.
用R语言进展分位数回归:根底篇
詹鹏
〔师大学经济管理学院〕
本文根据文献资料整理,以介绍方法为主要目的。作者的主要奉献有:〔1〕整理了分位数回归的一些根本原理和 根据Koenker(1994)的秩检验得到标准差的估计值。默认情况下假定残差是服从独立同分布。如果补充另一个参数iid=FALSE,则采用Machado(1999)的方法计算标准差〔参数的写法:se=〞rank〞, iid=FALSE〕。
-iid: 〔这个与上面提到的iid=FALSE不同,这里是参数se的一个取值,而上面的iid是一个逻辑参数〕假定残差服从独立同分布,并按照KB〔1978〕的方法计算残差。
-nid: 用sparsity算法计算的参数估计值标准差。
-ker: 用Powell(1990)的核密度估计方法得到标准差。
-boot: 采用bootstrap自助抽样的方法计算标准差。
-默认情况下,se=NULL且convariance=FALSE,标准差的默认算法是se=〞rank〞;其他情况下,se默认值为〞nid〞。
* covariance: 逻辑参数,是否返回参数估计量的协方差矩阵。
不同参数的结果,可参看下面的程序案例。
〔四〕分位数分解〔MM2005方法〕[9]
我们可以进一步运用分位数分解法对各个影响因素进展分解分析[10]。这里仅介绍MM2005方法。
-
. z.
为讲解方便,这里以各因素对城乡家庭收入的影响为例,观察各个影响因素在不同分位数上对城乡家庭收入差异的影响度的大小。这里介绍Machado和Mata[11]〔2005〕提出的分位数分解法,将每个分位数上的城乡收入差异分解为两个局部:一局部是由于城乡家庭劳动力特征的不同回报率引起的〔即分位数回归参数的不同引起的,The Return Effects〕,例如城乡家庭劳动力在一样的教育程度、工作年限以及所处当地的经济开展水平一样的特定因素下不同的回报率引起的家庭人均收入差异;另一局部是由于城乡家庭劳动力的特征变量分布不同引起的〔即影响因素变量值的不同引起的,The Covariate Effect〕,城乡家庭人均收入这局部的差异会随着样本分布的不同而略有变化。
利用Machado和Mata分位数分解方法的关键是进展反事实分析〔the counter-factual analysis〕,我们最关心的一种反事实分析就是,如果城市家庭劳动力按照农村家庭劳动力的分位数回归参数决定家庭人均收入的话,,其中表示影响城市家庭人均收入的变量分布,表示影响农村家庭人均收入的变量在每个分位数上的回归参数。表示如果城市家庭劳动力按照农村家庭劳动力的分位数回归参数决定家庭人均收入的话,城市家庭的反事实人均收入的大小。的具体计算步骤为:〔1〕确定不同的分位点,分别表示为。〔2〕在农村家庭样本中,分别以做分位数回归,得到组分位数回归参数向量。〔3〕将城市家庭样本数据表示为。〔4〕把〔2〕中得到的分位数回归参数和〔3〕中得到得城市家庭子样本变量分布相结合,得到一个新的样本,即反事实分布样本。
假定在τ分位数下城市家庭人均收入、反事实家庭人均收入和农村家庭人均收入分别为、、。则不同分位数下的城乡家庭人均收入分布差异可表示为:
等式右边的第一项称为“回报影响〔the return effect〕〞,它表示在不同的分位数下,由于城乡家庭劳动力的生产回报率不同所导致的城乡差异局部;等式右边第二项成为“变量影响(the covariate effect)〞,它表示不同分位数下城乡家庭随机抽样的样本变量分布不同所导致的城乡差异局部。
〔五〕非线性分位数回归和非参数分位数回归
暂略。
第二节用R语言进展分位数回归
〔一〕安装和加载包
R语言的根本包中没有进展分位数回归的程序包,故需要在官网下载并安装相应的程序包quantreg。在电脑上安装过quantreg包以后,下次不需要再次安装了。但每次使用分位数回归前,需要加载quantreg包。
(“quantreg〞) * 保持联网的情况下安装包
library(“quantreg〞) * 加载包
() * 进入R帮助首页
help(rq) * 获取rq函数的帮助,也可以写成:"rq
e*ample(rq) * 显示分位数回归函数rq()的一个简单例如代码
〔二〕一个简单的分位数回归模
用r语言进行分位数回归 来自淘豆网m.daumloan.com转载请标明出处.