下载此文档

R语言学习系列32-回归分析.docx


文档分类:IT计算机 | 页数:约28页 举报非法文档有奖
1/28
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/28 下载此文档
文档列表 文档介绍
NurfürdenpersönlichenfürStudien,Forschung,(因变量)与另一些变量(自变量)之间关系的统计方法。主要思想是用最小二乘法原理拟合因变量与自变量间的最佳回归模型(得到确定的表达式关系)。其作用是对因变量做解释、控制、或预测。回归与拟合的区别:拟合侧重于调整曲线的参数,使得与数据相符;而回归重在研究两个变量或多个变量之间的关系。它可以用拟合的手法来研究两个变量的关系,以及出现的误差。回归分析的步骤:(1)获取自变量和因变量的观测值;(2)绘制散点图,并对异常数据做修正;(3)写出带未知参数的回归方程;(4)确定回归方程中参数值;(5)假设检验,判断回归方程的拟合优度;(6)进行解释、控制、或预测。(一)一元线性回归一、:Y=𝛽0+𝛽1X+ε其中X是自变量,Y是因变量,𝛽0,𝛽1是待求的未知参数,𝛽0也称为截距;ε是随机误差项,也称为残差,通常要求ε满足:①ε的均值为0;②ε的方差为𝜎2;③协方差COV(εi,εj)=0,当i≠j时。即对所有的i≠j,εi与εj互不相关。用最小二乘法原理,得到最佳拟合效果的值:,(1)拟合优度检验计算R2,反映了自变量所能解释的方差占总方差的百分比,值越大说明模型拟合效果越好。,所得到的回归直线拟合得较好,,所得到的回归直线很难说明变量之间的依赖关系。(2)回归方程参数的检验回归方程反应了因变量Y随自变量X变化而变化的规律,若𝛽1=0,则Y不随X变化,此时回归方程无意义。所以,要做如下假设检验:H0:𝛽1=0,H1:𝛽1≠0;①F检验若𝛽1=0为真,则回归平方和RSS与残差平方和ESS/(N-2)都是𝜎2的无偏估计,因而采用F统计量:来检验原假设β1=0是否为真。②T检验对H0:𝛽1=0的T检验与F检验是等价的(t2=F)。,预测X=:其中tα/2的自由度为N-、R语言实现使用lm()函数实现,基本格式为:lm(formula,data,subset,weights,,method="qr",...)其中,formula为要拟合的回归模型的形式,一元线性回归的格式为:y~x,y表示因变量,x表示自变量,若不想包含截距项,使用y~x-1;data为数据框或列表;subset选取部分子集;weights取NULL时表示最小二乘法拟合,若取值为权重向量,则用加权最小二乘法;;method指定拟合的方法,目前只支持“qr”(QR分解),method=“”返回模型框架。三、实例例1现有埃及卡拉马村庄每月记录儿童身高的数据,做一元线性回归。datas<-(age=18:29,height=c(,77,,,,,,,,,,))(datas)#<-lm(height~age,datas)#做一元线性回归summary()#输出模型的汇总结果Residuals:Min1QMedian3QMax---:(>|t|)(Intercept)<2e-16***-11***---:0‘***’‘**’‘*’‘.’‘’1Residualstandarderror:-squared:, AdjustedR-squared:-statistic:880on1and10DF,p-value:-11说明:输出了残差信息Residuals;回归系数估计值、标准误、t统计量值、p值,可得到回归方程:height=+*age回归系数p值(<2e-16,-11)很小,非常

R语言学习系列32-回归分析 来自淘豆网m.daumloan.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数28
  • 收藏数0 收藏
  • 顶次数0
  • 上传人一花一世
  • 文件大小476 KB
  • 时间2019-10-25