下载此文档

R语言方法总结样稿.doc


文档分类:金融/股票/期货 | 页数:约22页 举报非法文档有奖
1/22
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/22 下载此文档
文档列表 文档介绍
计算描述性统计量:
1、summary():
例: summary(mtcars[vars])
summary()函数提供了最小值、最大值、四分位数和数值型变量均值,和因子向量和逻
辑型向量频数统计。
2、apply()函数或sapply()函数
计算所选择任意描述性统计量。mean、 sd、 var、 min、 max、 median、 length、 range
和quantile。函数fivenum()可返回图基五数总括(Tukey’s five-number summary,即最小值、
下四分位数、中位数、上四分位数和最大值)。
sapply()
例: mystats <- function(x, = FALSE) {
if ()
x <- x[!(x)]
m <- mean(x)
n <- length(x)
s <- sd(x)
skew <- sum((x - m)^3/s^3)/n
kurt <- sum((x - m)^4/s^4)/n - 3
return(c(n = n, mean = m, stdev = s, skew = skew, kurtosis = kurt))
}
sapply(mtcars[vars], mystats)
3、describe():
Hmisc包:返回变量和观察数量、缺失值和唯一值数目、平均值、
分位数,和五个最大值和五个最小值。
例: library(Hmisc)
describe(mtcars[vars])
4、():pastecs包
若basic=TRUE(默认值),则计算其中全部值、空值、缺失值数量,和最小值、最 大值、值域,还有总和。
若desc=TRUE(一样也是默认值),则计算中位数、平均数、平均数标准误、平均数置信度为95%置信区间、方差、标准差和变异系数。
若norm=TRUE(不是默认),则返回正态分布统计量,包含偏度和峰度(和它们统计显著程度)和Shapiro–Wilk正态检验结果。这里使用了p值来计算平均数置信区间(:
例: library(pastecs)
(mtcars[vars])
5、describe():psych包
计算非缺失值数量、平均数、标准差、中位数、截尾均值、绝对中位差、最小值、最大值、值域、偏度、峰度和平均值标准误
例: library(psych)
describe(mtcars[vars])
分组计算描述性统计量
1、aggregate():
例:aggregate(mtcars[vars], by = list(am = mtcars$am), mean)
2、by():
例: dstats <- function(x)(c(mean=mean(x), sd=sd(x)))
by(mtcars[vars], mtcars$am, dstats)
by(mtcars[,vars],mtcars$am,plyr::colwis(dstats))
3、summaryBy():doBy包
例 library(doBy)
summaryBy(mpg + hp + wt ~ am, data = mtcars, FUN = mystats)
4、():doBy包(()函数不许可指定任意函数,)
例:library(psych)
(mtcars[vars], mtcars$am)
5、reshape包分组:(重铸和融合)
例:library(reshape)
dstats <- function(x) (c(n = length(x), mean = mean(x),
sd = sd(x)))
dfm <- melt(mtcars, = c("mpg", "hp",
"wt"), = c("am", "cyl"))
cast(dfm, am + cyl + variable ~ ., dstats)
频数表和列联表
1、table():生成简单频数统计表
mytable <- with

R语言方法总结样稿 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数22
  • 收藏数0 收藏
  • 顶次数0
  • 上传人梅花书斋
  • 文件大小329 KB
  • 时间2020-11-29