下载此文档

R语言实验指导书.docx


文档分类:IT计算机 | 页数:约10页 举报非法文档有奖
1/10
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/10 下载此文档
文档列表 文档介绍
该【R语言实验指导书 】是由【mazhuangzi1】上传分享,文档一共【10】页,该文档可以免费在线阅读,需要了解更多关于【R语言实验指导书 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。R语言实验指导书(二)
2016年10月27日
实验三创建和使用R语言数据集
一、 实验目的:
了解R语言中的数据结构。
熟练掌握他们的创建方法,和函数中一些参数的使用。
对创建的数据结构进行,排序、查找、删除等简单的操作。
二、 实验内容:
向量的创建及因子的创建和查看
有一份来自澳大利亚所有州和行政区的20个税务会计师的信息样本1以及他们各自所在地的州名。州名为:tas,sa,qld,nsw,nsw,nt,wa,wa,qld,vic,nsw,vic,qld,qld,sa,tas,sa,nt,wa,vic。
将这些州名以字符串的形式保存在state当中。
创建一个为这个向量创建一个因子statef。
使用levels函数查看因子的水平。
2、(2jL€-36-2Li一一"Emg二nYourHa^rn
Cc;cyr^ght(C) 2Cl6二二已?.Foundat^jnEorS二日t■二3二二u已二二二咗■二ng
FLatfjrm:^Sz6-w6^-ming77S2/^SS6(S2-bLTj
R是自弓软件,K带任何担保「
在其些条件匚你可以熔其自三戡布匚
M'二二umn吕已门■或,Licence门'来看戡布E勺锌胡条伴■=
R是个合作计划.•有许雪人为”之做世二片献.
用'contr£butoi?s()1来看合作者的详细情况
=-^at^n(i■
三丄二三
demo(:i 看一些亍范程孚,.三二们■穴闫读在线帮助文件,或
-()'ifii±.-TML浏览器丟看帮助文件■:
q':),退出
state<-ci'tasfsaf ns^-.-7f ;wafwafcildfv^c;--Tfv^c;. cjld
错误:找K到对象・衣扩
state<-c\''z&=""fnr.=~-'Tf",TfnVLCnf
factoristate)
[二]tassaqldnswnswntwawaqlciV-3nswvlsqldqlcim日Tassantlevel3:nswntqldsatas节二uwa
Levelsistate)
MULL
st-at-sf<-factcr(state)
l£'-r£lSistatsf)
:L:,rnsw,r"nt"prqLdprprsarr,rtas,rrrvicprprwa,r
矩阵与数组。
创建一个4*5的数组如图,创建一个索引矩阵如图,用这个索引矩阵访问数组,观察结果。
LJJ
[②
Lh3J

[石」
[1J
1
5
9
13
17
L2J
2
6
10
14
18
旧」

7
11
th
19
WJ
4
a
12
L6
20

[,2]
LU
1
3
L2J
3
2
1^.1

1
ni兰且zzay<~azzay(1:2Ofc(4f5))
m童且zzay
.iF2.
:亍
-5
1
5
g
13
17
2*
2
6
10
14
IS
3
11
15
19
■b
4
D
■—1
12
16
20
x<-c(1:3)
y<-c(3:1)
cells<-c(xfy)
iu'bi且匸zix<-
mVTiatrix<-matrlx(cellsfnzow=3fneo1=2)
>IUgHLa匸二jLX
一1
]2
-■
[3,] 3
1
m誉且zzay[mvTi且匸二Lx[工:3卢丄:3::
Errorinmyma匸工:ixj[l: 1:3]:下卡不已界
myazzay[mvTaatzix[1:3f1:2;:
[1]963
巩兰且zray[niVTi且匸二Lx[1:3f2:1;:
[1]369
错误:意夕卜=j':■'二nrrinyarray[:L:S:,myiiiatrix:L:S::-
>巩兰且zzay[niVTi且匸二Lx[丄:3:fievti且匸工:Lx[1:3:
,1] [,2J [,3]
15 9
2 6 10
3 7 11
将之前的state,数组,矩阵合在一起创建一个长度为3的列表。
错误:找K至[对象恤t.=mi
>mylLst
rrsarr
rrqldrrrrnswrrrrnswrrrrntrr


|rrTdBrr
----
3[订
[B]
二,
L
5
9 LS
L-

LO 二匚
L=
S
二二 15
L9
上r
L2
29
工三
:,二
・FW-
二,
1
S
S

i5tatei,nyarrayfiu\TuatrLX)
IUtlL3t
rrwarrrrwarrrrqldrrrrvicrr"ns苗"rrvicrrrrqLd
创建一个数据框如图。
mpgcyl
disp
hpdrat
MazdaRX4

6

110

MazdaRX4Wag

6

110

Datsun710

4

93
3・85
Hor门电t4Dri\/e

6

110

吨g
wt
drat
Mazda
RX£
2L.:■
LL:■


Mazda
RXWWag
2L.:■
LL:■


Datsun

95
:■

Hornet
tDrive

LL:■


Hornet
orTabout.
LS.-
L~5


Valiant

LD5

2."6
将这个数据框按照mpg列进行排序。
>mydat-a[crder(iaydata\f'-\#症亡心二巳己己二二&=二)
inpg

wt
drat

_1j
22.=
9s


Hornet
tDri^ze

LIj

=
Mazda
RX£

LIj


Mazda
RXWWag

LIj


Hornet
.
1=._
L-5


.
1=.二
LD5

2.~6

>myciata[vrti二匚二(invclata$==)
眄g
wt
drat
Mazda
RXU
2L
LLO


Mazda
RXCWdg
2L
LLO


三、 实验要求
要求学生熟练掌握向量、矩阵、数据框、列表、因子的创建和使用。
实验四数据的导入导出
一、 实验目的
熟练掌握从一些包中读取数据。
熟练掌握csv文件的导入。
创建一个数据框,并导出为csv格式。
二、 实验内容
创建一个csv文件(内容自定),并用readtable函数导入该文件。
查看R语言自带的数据集airquality(纽约1973年5-9月每日空气质量)。
列出airquality的前十列,并将这前十列保存到air中。
查看airquality中列的对象类型。
查看airquality数据集中各成分的名称
将air这个数据框导出为csv格式文件。((x,file="",sep="",=TRUE,=TRUE,quote=TRUE))
三、实验要求
要求学生掌握从包中读取数据,导入csv文件的数据,并学会将文件导出。
实验五R语言数据的清洗
一、 实验目的
查看数据集的缺失值,并学会对缺失值进行处理。
对异常变量重新赋值。
将某一列的字符型转化为日期型。
()获取子集。
二、 实验内容
有一个数据框代码如下,使用summary函数查看,那一列含有缺失值,有几个。并查看wind列的最大值。
Ozone<-c(41,36,12,18,NA,28)
〈—c(190,118,149,313,NA,NA)
wind<-c(,,,,,)
Temp<-c(67,82,74,62,86,66)
date<-c(〃1997/05/01〃,〃1997/05/02〃,〃1997/05/03〃,〃1997/05/04〃,〃1997/05/05〃,〃1997/05/06〃)
air〈-(date,Ozone,,wind,Temp,stringsAsFactors=FALSE)
使用class()函数查看date函数的类型,并将其转化为data型,格式为月/日/年。
使用subset()根据Temp列获取air中Temp大于60小于70的数据。
将air中含有缺失值的列去掉。
找出Temp中大于85的值将其设置为缺失值。
创建一个air1包含两个列q1,q2。用cbind函数添加到air中。
使用names函数查看air的列名,并根据列自己创建一个数据框。使用rbind函数添加到air中
三、 实验要求
要求学生会用subset获取子集,学会对缺失值进行一些简单的处理和对一些异常值的
查找和修改。
实验六高级数据管理
一、 实验目的
学会简单的数值和字符处理函数。
学会自己编写一个函数。
二、 实验内容
使用下面代码创建roster数据集。
Student<-c("JohnDavis","AngelaWilliams",
"BullwinkleMoose","DavidJones",
"JaniceMarkhammer","CherylCushing",
"ReuvenYtzrhak","GregKnox","JoelEngland","MaryRayburn")
Math<-c(502,600,412,358,495,512,410,625,573,522)
Science<-c(95,99,80,82,75,85,80,95,89,86)
English<-c(25,22,18,15,20,28,15,30,27,18)roster<-(Student,Math,Science,English,stringsAsFactors=FALSE)

计算该班级数学的平均成绩,最高成绩。
将成绩单按照姓和名进行排序,将学生的各科考试成绩组合为单一的成绩衡量指标、基于相对名次(前20%,下20%,等等)给出从A到F的评分。
使用quantile函数按20%,40%,60%,80%,求分位数。
使用变量重命名的方法将grade列分为A、B、C、D、F几个等级。
使用strsplit函数将Student列的名字分割,存到name中。
创建一个函数xl,功能为实现返回值为传入参数的第一个值。
使用sapply函数将name中的firstname提取出来。(“sapply(data,function)")同理即可提取出lastname。
将lastname和firstname与roster合并,同时去掉roster的第一列。
将成绩单用姓和名进行排序。
三、实验要求要求学生学会一些简单的数值和字符处理函数。学会如何自己创建一个函数。和对一些简单问题的处理。
实验七基本统计分析实验
一、 实验目的
学会使用summary函数和Hmisc包中的describe函数来计算统计量。
使用table函数生成一维、二维、多维列联表。
学会用R实现卡方独立性检验。
学会用R进行相关性的度量。
学会用R进行Pearson、Spearman和Kendall相关。
学会用R进行相关性的显著性检验。
学会用R进行组间差异的非参数检验。
二、 实验内容
描述性统计分析
1) 对R自带的数据集rock(48块石头的形态数据)使用summary函数、Himisc包中的describe函数、。
2) 使用aggregate、doby中的summaryBy对sleep数据集的group列分组获取描述性统计量。
频数表和列联表
1) 加载vcd包中的Arthritis数据集使用table生成简单的频数统计表。
2) 使用table、xtabs对Arthritis生成二维列联表。并使用addmargins为这些表格添加边际和(根据Treatment、Improved)o
3) 使用xtabs,table生成三维列联表(根据Treatment、sex、Improved三个因子)。
4) ()函数对二维表的行和列进行卡方独立性检验,并观察他们是否独立。
5) 使用vcd包中的assocstats()函数计算二维列联表的phi系数、列联系数和Cramer'sV系数。
相关
1)Pearson、Spearman和Kendall相关
a) 对state・x77数据集计算方差和协方差>Pearson积差相关系数、Spearman等级相关系数。
b) 、Murder因子计算相关显著性检验
T检验
1)比较了南方(group1)和非南方(group0)各州的监禁概率(,So因子为是否为南方,Prob因子表示监禁率)。
组间差异的非参数检验。
1)使用Mann-WhitneyU检验回答4中关于监禁率的问题,。
三、 实验要求
通过本次实验让学生学会基本统计分析用到的频数表、列联表、相关、t检验、组间差异的分参数检验。让学生可以掌握一些基本的统计分析的概念和如何用R来进行统计分析。

R语言实验指导书 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数10
  • 收藏数0 收藏
  • 顶次数0
  • 上传人mazhuangzi1
  • 文件大小48 KB
  • 时间2022-10-19
最近更新