Lec00
## 八、关于Markdown语言的简洁说明
1. 一个#表示一级标题,二个#表示二级标题,依次类推;
2. 空一段表示断行,而不是简单的敲一个回车表示断行;
3. *斜体* (一对星号)表示斜体,**加粗** (一对双星号)表示加粗;
4. Markdown语言兼容Latex语言。可处理数学公式
Lec01
## 1 数据的基本形式
所有R处理的内容都叫对象(object)。进行统计分析时,我们的对象自然就是数据(data)。在R中,数据的基本格式分为以下5种:标量(scalar),向量(vectors),矩阵(matrices),数据框(data frames),因子(factors),及列表(lists)。
所谓**向量**,就是一维的数值型、字符型或逻辑型数据的一维数组
a <- c(1, 2, 3, 4, -2, -5, 6) # 数值型,其中c表示concatenate(连结,串联),c()bine function, <-表示赋值
a # 显示向量a
b <- c("one", "two", "three") # 字符型,需要使用“”
c <- c(TRUE, TRUE, TRUE, FALSE, TRUE, FALSE) # 逻辑型
d <- c(1:5) # :表示产生一个系列,元素默认按列填充
矩阵是一个二维数组,但要求其中的每个元素具有相同的模式(同为数值型、字符型或逻辑型)注意:每个元素的数据格式必需相同.
y <- matrix(1:20, nrow=4, ncol=5) #定义4行5列
y[1,] ; y[,2] ; y[1,2] ; y[1,c(2,3)] ; y[c(2,3),2] # 显示矩阵y内的不同元素
#### 定义名为matrix1的2×2矩阵,定义行列名,按行填充
cells <- c(1,-2,3,-4) ; rnames <- c("R1", "R2") ; cnames <- c("C1", "C2")
matrix1<- matrix(cells, nrow=2, ncol=2, byrow=TRUE,dimnames=list(rnames, cnames))
数组(Array):三维或高维数据。数组与矩阵类似,但维度高于2维。
array()函数的格式为: _array(vector, dimensions, dimnames)_ ,其中
* vector表示向量,
* dimensions表示每个维度下的向量“长度”(元素个数),
* dimnames表示维度名。
dim1 <- c("A1", "A2") ; dim2 <- c("B1", "B2", "B3") ; dim3 <- c("C1", "C2", "C3", "C4")
z <- array(1:24, c(2, 3, 4), dimnames=list(dim1, dim2, dim3)) # c(2, 3, 4)中的数字,表示dim1, dim2, dim3的长度
数据框(dataframe):包含不同类型数据的数据。数据框的数据形式,就是常见的excel,spss,stata中的数据表单形式,它可以用来同时储存多种不同模式的数据。
数据框函数: *() function* ,其格式如下:
*mydata <- (col1, col2, col3,…)*
其中, col1, col2, col3, …是任意类型的列向量名(需提前定义)。
patientID <- c(1, 2, 3, 4) # 数值型向量; age <- c(25, 34, 28, 52) # 数值型向量; diabetes <- c("Type1", "Type2", "Type1", "Type1") # 字符型; status <- c("Poor", "Improved", "Excellent", "Poor") # 字符型
patientdata <- (patientID, age, diabetes, status,=patientID) # 以上述向量,建立数据框
上述命令中,=patientID为指定“实例标识符”(case identifier)。设定此选项后,(patientdata)命令,就可以以patientID为标记输出各个体的编号(ID)。
#### 观测与变量
patientdata[1:2] # 显示数据框中的第1至2列(第1至2个变量)
patientdata[2,4] # 显示第
R语言总结 来自淘豆网m.daumloan.com转载请标明出处.