面板数据的概念面板数据是时间序列数据和截面数据相结合的二维数据,为方面起见,暂且将之统称为TC数据(即时间截面二维数据的意思),以我国31个省份1991-1999年的GDP数据为例,则每一个年度称为一个截面,每个省份称为一个个体,每一个年度的31个省份的GDP数据(31个)就是截面数据,每一个省份的9年的GDP数据(9个)就是时间序列数据,即GDP这个变量在时间维度有9个取值,在截面维度有31个取值,这些数据合在一起就是TC数据,共31*9=279个。如果每个截面包含相同数量的个体,则称之为平衡TC数据,否则为非平衡TC数据。面板数据的主要优点有:有利于降低多重共线性程度。增加数据纬度的同时也增加了样本容量,样本容量增加可以增加变量之间的差异,降低变量间的相关程度,从而降低共线性程度。可以进行模型效应分析,更准确地理解统计结果的实际含义。面板数据模型的种类面板数据模型分为PooledData模型和PanelData模型二类,PooledData模型适用于研究时期较多个体较少的TC数据,须为每个个体命名,研究目的侧重于个体差异或时期趋势;PanelData模型适用于研究个体较多、时期较少的TC数据,不须为每个个体命名,研究目的侧重于由时期差异或个体推断总体。另外,PooledData模型允许各时期的个体不相同,PanelData模型要求各时期的个体相同。例如:pooleddatat=1:ABCDFt=2:ABDEpaneldatat=1:ABCDEt=2:ABCDE模型的基本形式PooledData模型,…………①PanelData模型,…………①其中,可以是非线性的。比较分析:由于研究目的不同,所以前者允许系数可变,后者假定系数不变。模型形式的分类根据模型是否存在个体效应(即不同的个体是否有不同的模型),可分为效应模型和无效应模型两类,其中,PooledData模型的效应模型又分为变系数模型和变截距模型两种;PanelData模型的效应模型只有变截距模型一种。所以,PooledData模型有3种,PanelData模型只有2种。效应模型变系数模型如果对不同的(),和都不相同,则称为个体(时期)效应变系数模型,可表示为:…………②或:变系数模型等价于在模型中纳入“单独的个体哑变量项”和“个体哑变量与自变量的交叉项”来体现个体差异。该模型用于描述:x和y的关系不仅在个体之间存在显著差异,而且x对这种差异有显著影响,或者说,x是产生这种差异的影响因素。这种结论是普通回归模型难以得到的(因为代表个体的哑变量须设置很多“二分变量”)。变截距模型如果对不同的(),只是不相同,但相同,则称为个体(时期)效应变截距模型,可表示为:…………③或:变截距模型等价于在模型中纳入“单独的个体哑变量项”来体现个体差异。该模型用于描述:x和y的关系在不同个体存在显著差异。无效应模型如果对不同的(),和都相同,则称为混合模型,可表示为:…………④该模型用于描述:x和y的关系与个体或时期均无关。模型效应包括固定效应和随机效应2种,当个体就是总体时,则称之为固定效应模型(FE);当个体是来自总体的随机样本时,则称之为随机效应模型(RE)。对于平衡数据,Eviews可以估计“双向FE”或“双向RE”,非平衡数据则不能。模型选择模型形式选择PooledData模型形式选择-F检验假设::假设模型为变截距模型:假设模型为混合模型统计量~~其中,S1、S2、S3分别表示变系数模型、变截距模型和混合模型的残差平方和,N是样本个数,K是外生变量个数,T是时期总数。(注:S1和S2均采用FE模型计算,可从回归结果中取得,然后手工计算F1和F1)检验规则如果F2小于临界值(),则不否定H02,应选择混合模型;如果F2、F1均大于临界值(),则否定H02和H01,应选择FE变系数模型;如果F2大于临界值但F1小于临界值(,),则否定H02但不否定H01,应选择FE变截距模型。.[参考]F检验的Eviews操作:估计变系数模型(无约束模型),做F检验(View/Fixed/RandomEffectsTesting/RedundantFixedEffects-LikelihoodRatio下同),P值记为p1;估计变截距模型(相对混合模型而言,也是无约束模型),做F检验,P值记为p2。当p1<临界值时,则否定“约束”,故采用变系数模型当p1>临界值,但p2<临界值时,则否定“截距”约束,但不否定“斜率”约束,故采用变截距模型当p1、p2都>临界值时,则不否定“截距”约束,也不否定“斜率”约束,故采用混合模型PanelData模型形式选择-LikelihoodRatio检验PanelData模型形式包
TC数据模型 来自淘豆网m.daumloan.com转载请标明出处.