一元线性回归分析
回归分析是最为基本的定量分析工具,很多表面看来与回归分析无关、并且貌似难以理
解的数学方法,可以通过回归分析得到简明的解释。通过回归分析,可以更好地理解因子分
析、判别分析、自回归分析、功率谱分析、小波分析、神经网络分析,如此等等。在本书中,
作者将会建立回归分析与因子分析、判别分析、时间序列分析、灰色系统的GM(1,N)预测分
析等的数学联系。在各种回归分析方法中,一元线性回归最为基本。熟练掌握这一套分析方
法对学习其他数学工具非常有用。下面借助简单的实例详细解析基于Excel 的一元线性回归
分析。
【例】某地区最大积雪深度和灌溉面积的关系。为了估计山上积雪溶化后对河流下游灌
溉的影响,在山上建立观测站,测得连续10 年的最大积雪深度和灌溉面积数据。利用这些
观测数据建立线性回归模型,就可以借助提前得到的积雪深度数据,预测当年的灌溉面积大
小。原始数据来源于苏宏宇等编著的《Mathcad2000 数据处理应用与实例》。
§ 模型的初步估计
这是非常初步的操作,但却是非常重要的操作。我们在建立回归分析模型的过程中,首
先要进行一些基本的试验。在Excel 中,回归试验应用最为频繁的方法就是下面即将讲到的
模型快速估计方法。
第一步,录入数据。数据录入结果见下图
第二步,作散点图。如图1-1-2 所示,选中数据(包括自变量和因变量),点击“图表
向导”图标;或者在“插入”菜单中打开“图表(H)”。图表向导的图标为
选中数据后,数据变为蓝色(图1-1-2)。
点击“图表向导”以后,弹出如下对话框(图1-1-3)
在左边的“图表类型(C)”栏中选中“XY 散点图”,点击“完成”按钮,立即出现散
点图的原始形式(图1-1-4):
(2)添加趋势线:点击“添加趋势线(R)”,弹出如下选择框(图1-1-6):
(3)选项设置:在分析“类型”中选择“线性(L)”,然后打开选项单(图1-1-7)。
(4)获取结果:在选择框中选中“显示公式(E)”和“显示R 平方值(R)”(图1-1-7),
确定,立即得到回归结果如下(图1-1-8)。
在图1-1-8 中, 给出了回归模型和相应的测定系数即拟合优度。模型为
y=+,相关系数平方为R2=。
§ 详细的回归过程
回归建模
回归模型的快速估计过程非常简便,但结果也过于简略。除了模型的截距、斜率估计结
果和相关系数平方等统计量之外,没有其他方面的统计信息。为了对模型参数估计值开展深
入的统计分析,我们需要掌握详细的回归分析过程。在Excel 中,回归分析过程可以分为若
干步骤完成,第一、第二步与第1 小节“模型的初步估计”给出的完全一样,姑且从略。下
面从第三步讲起。
第一步,录入数据(略)。
第二步,作散点图(略)。
第三步,回归分析。
观察如图1-1-4 所示的散点图,判断点列分布是否具有线性趋势。只有当数据具有线性
分布特征时,才能采用线性回归分析方法。从图中可以看出,本例数据形成的散点呈现线性
分布特征,可以进行线性回归。详细步骤如下。
打开对话框:用鼠标点击“工具”下拉菜单,可见数据分析选项(图1-2-1):
用鼠标双击“数据分析(D)”选项,弹出“数据分析”选项框(图1-2-2)。
回归分析选项:在图1-2-2 中选择“回归”,确定,弹出如下选项表(图1-2-3)
第一种选择方式——包括数据标志:X、Y 值的输入区域(B1:B11,C1:C11),标志,
置信度(95%),新工作表组,残差,线性拟合图(图1-2-4)。
第二种选择方式——不包括数据标志:X、Y 值的输入区域(B2:B11,C2:C11),置信
度(95%),新工作表组,残差,线性拟合图(图1-2-5)。
注意:选中数据“标志”和不选“标志”,X、Y 值的输入区域是不一样的:前者包括
数据标志“最大积雪深度(米)”和“灌溉面积(千亩)”。后者不包括。当在输入滥的数据
范围中包括数据标志所在的单元格时,务必选择“标志”选项,否则不能选中“标志”。这
一点务请注意。
(3)给出回归结果:设置完成以后,确定,即可得到全部回归结果(图1-2-6)。
(4)读取参数:在图1-2-6 所示的结果中,读取如下数据,据此建立模型并开展统计
分析。截距:a=;斜率:b=;相关系数:R=;测定系数:R2=;F 值:
F=;t 值:t=;回归标准误差:s=;回归平方和:SSr=;剩余平方
和:SSe=;总平方和:SSt=。
(5)写出模型
《基于Excel 的地理数据分析》一元线性回归分析 来自淘豆网m.daumloan.com转载请标明出处.