下载此文档

R语言方法总结.doc


文档分类:IT计算机 | 页数:约14页 举报非法文档有奖
1/14
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/14 下载此文档
文档列表 文档介绍
计算描述性统计量:1、summary():例:summary(mtcars[vars])summary()函数提供了最小值、最大值、四分位数和数值型变量的均值,以及因子向量和逻辑型向量的频数统计。2、apply()函数或sapply()函数计算所选择的任意描述性统计量。mean、sd、var、min、max、median、length、range和quantile。函数fivenum()可返回图基五数总括(Tukey’sfive-numbersummary,即最小值、下四分位数、中位数、上四分位数和最大值)。sapply()例:mystats<-function(x,=FALSE){if()x<-x[!(x)]m<-mean(x) n<-length(x) s<-sd(x) skew<-sum((x-m)^3/s^3)/n kurt<-sum((x-m)^4/s^4)/n-3 return(c(n=n,mean=m,stdev=s,skew=skew,kurtosis=kurt))}sapply(mtcars[vars],mystats)3、describe():Hmisc包:返回变量和观测的数量、缺失值和唯一值的数目、平均值、分位数,以及五个最大的值和五个最小的值。例:library(Hmisc)describe(mtcars[vars])4、():pastecs包若basic=TRUE(默认值),则计算其中所有值、空值、缺失值的数量,以及最小值、最大值、值域,还有总和。若desc=TRUE(同样也是默认值),则计算中位数、平均数、平均数的标准误、平均数置信度为95%的置信区间、方差、标准差以及变异系数。若norm=TRUE(不是默认的),则返回正态分布统计量,包括偏度和峰度(以及它们的统计显著程度)和Shapiro–Wilk正态检验结果。这里使用了p值来计算平均数的置信区间(:例:library(pastecs)(mtcars[vars])5、describe():psych包计算非缺失值的数量、平均数、标准差、中位数、截尾均值、绝对中位差、最小值、最大值、值域、偏度、峰度和平均值的标准误例:library(psych)describe(mtcars[vars])分组计算描述性统计量1、aggregate():例:aggregate(mtcars[vars],by=list(am=mtcars$am),mean)2、by():例:dstats<-function(x)(c(mean=mean(x),sd=sd(x)))by(mtcars[vars],mtcars$am,dstats)by(mtcars[,vars],mtcars$am,plyr::colwis(dstats))3、summaryBy():doBy包例library(doBy)summaryBy(mpg+hp+wt~am,data=mtcars,FUN=mystats)4、():doBy包(()函数不允许指定任意函数,)例:library(psych)(mtcars[vars],mtcars$am)5、reshape包分组:(重铸和融合)例:library(reshape)dstats<-function(x)(c(n=length(x),mean=mean(x),sd=sd(x)))dfm<-melt(mtcars,=c("mpg","hp","wt"),=c("am","cyl"))cast(dfm,am+cyl+variable~.,dstats)频数表和列联表1、table():生成简单的频数统计表mytable<-with(Arthritis,table(Improved))Mytable2、():频数转化为比例值(mytable)3、()*100:转化为百分比(mytable)*100二维列联表4、table(A,B)/xtabs(~A+b,data=mydata)例:mytable<-xtabs(~Treatment+Improved,data=Arthritis)5、()():函数分别生成边际频数和比例(1:行,2:列)行和与行比例(mytable,1)(mytable,1)列和与列比例(mytable,2)(mytable,2)(mytable)6、addmargins():函数为这些表格添加边际和addmargins(mytable)admargins((mytable))addmargins((mytable,1),2)addmargins((mytable,2,1)():gmodels包例:library(gmodels)CrossTable(Arthritis$Treatment,Arthritis$Improved)多维列联表1、

R语言方法总结 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数14
  • 收藏数0 收藏
  • 顶次数0
  • 上传人梅花书斋
  • 文件大小328 KB
  • 时间2020-02-14
最近更新