下载此文档

【原创】R语言线性回归 :多项式回归案例分析报告附代码数据.docx


文档分类:IT计算机 | 页数:约8页 举报非法文档有奖
1/8
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/8 下载此文档
文档列表 文档介绍
【原创】附代码数据
有问题到淘宝找“大数据部落”就可以了
线性回归模型尽管是最简单的模型,但它却有不少假设前提,其中最重要的一条就是响应变量和解释变量之间的确存在着线性关系,否则建立线性模型就是白搭。然而现实中的数据往往线性关系比较弱,QssssraBQW0SHW©Q©o
oOGO80^08O©oo009◎oasrloEEglMSWWIDOQDDo
8o^******@08©oo&8
8@
o
o
oooss
OS§o
80OOQWisBSBy©8oo008ssea^oo§^6-******@******@0Soo'o
oo
oo
ooo
oo
-******@******@0©******@AHI0*******@o80®8©***@oSH8O9Oooo8
080ofii0ww®g§o8o
Q
°
oa-
QoQ
ooo
oO
8
******@******@Q©o
ooo
******@0^BMB00sw§***@o000Sa§ofi0o8d00&SH0B0B8OOoO§QA8§oo-
8oo§o_§
800§******@8
QH0O80o
Q
-sC
©0
-o
203040506070
age
agevswage
可见这两条变量之间根本不存在线性关系,最好是拟合一条曲线使散点均匀地分布在曲线两侧。于是尝试构建多项式回归模型。
>fit=lm(wage~poly(age,4),data=Wage)#构建age的4次多项式模型
>#构造一组age值用来预测
>agelims=range(age)
>=seq(from=agelims[l],to=agelims[2])
【原创】附代码数据
有问题到淘宝找“大数据部落”就可以了
>preds=predict(行t,newdata=list(age=),se=T)
>=cbind(preds$fit+2*preds$,preds$fit-2*preds$)#构建预测值的置信区间
>plot(age,wage,xlim=agelims,cex=,col="darkgrey")
>title("Degree-4Polynomial",outer=T)
>lines(,preds$fit,lwd=2,col="blue")#多项式回归预测曲线
>matlines(,,lwd=2,col="red",lty=3)#置信区间曲线
【原创】附代码数据
有问题到淘宝找“大数据部落”就可以了
Degree-4Polynomial
g
CM
■:u
o
M
3
◎0
n?■■
PC®•0.
【原创】附代码数据
有问题到淘宝找“大数据部落”就可以了
【原创】附代码数据
有问题到淘宝找“大数据部落”就可以了
203040506070BO
age
4次多项式回归模型
从图中可见,采用4次多项式回归效果还不错。那么多项式回归的次数具体该如何确定?
在足以解释自变量和因变量关系的前提下,次数应该是越低越好。方差分析(ANOVA)也可用于模型间的检验,比较模型Ml是否比一个更复杂的模型M2

【原创】R语言线性回归 :多项式回归案例分析报告附代码数据 来自淘豆网m.daumloan.com转载请标明出处.

非法内容举报中心
文档信息
最近更新