[读书笔记] R语言实战 (二) 创建数据集

R中的数据结构:标量,向量,数组,数据框,列表

1. 向量:储存数值型,字符型,或者逻辑型数据的一维数组,用c()创建

**  R中没有标量,标量以单元素向量的形式出现

2. 矩阵:二维数组,和向量一样只能是相同模式, 可用matrix() 创建

#byrow指定是否按行填充,默认是按列填充,dimnames包含可选的字符向量型列名和行名
mymatrix <- matrix(vector, nrow = number_of_rows, ncol =         
                              number_of_columns, byrow = TRUE/FALSE, dimnames = 
                              list(char_vector_rownames, char_vector_colnames)

3. 数组:和矩阵类似,维度可以大于2,通过array()函数创建

4. 数据框:不同的列可以包含不同的模式, data.frame()创建

#创建向量
a <- c(1,2,7,4,10,6)
a[c(1,3,5)]
#创建矩阵,按列填充
y <- matrix(1:20,nrow=5,ncol=4)
y
#按行填充
y <- matrix(1:20,nrow=5,ncol=4,byrow = TRUE)
y
#添加行名,列名
cells <- c(1,26,24,68)
rnames <- c("R1","R2")
cnames <- c("C1","C2")
mymatrix <- matrix(cells,nrow=2,ncol=2,byrow=TRUE,dimnames=list(rnames,cnames))
mymatrix

#创建数组
dim1 <- c("A1","A2")
dim2 <- c("B1","B2","B3")
dim3 <- c("C1","C2","C3","C4")
z <- array(1:24,c(2,3,4),dimnames=list(dim1,dim2,dim3))
z
#创建数据框
patientID <- c(1,2,3,4)
age <-c(25,34,28,52)
diabetes <- c("Type1","Type2","Type2","Type1")
patientData <- data.frame(patientID,age,diabetes)
patientData

5. attach(), detach(), with()

attach()可以将数据框添加到R的搜索路径当中

detach() 将数据框从搜索路径删除

6. 列表:一些对象(或成分,component)的有序集合,某个列表可能是若干向量、矩阵、数据框、甚至其他列表的组合。可以用list()创建列表

列表是R中重要的数据结构:1)允许以一种简单的方式组织和重新调用不相干的信息,2)R中许多运行结果都是以列表的形式返回。

 7. 数据输入

1) 键盘输入 edit() 函数

2) 从带分隔符的文本文件导入数据 read.table()

3) 导入EXCEL数据read.xlsx()

4) 其他

8. 处理对象实用函数

#创建向量
a1 <- c(1,4,6,8,5)
a2 <- c(5,8,6,4,1)
length(a1)
#创建3*4矩阵按行填充
mat1 = matrix(1:12,nrow=3,ncol=4,byrow=TRUE,dimnames = list(c('r1','r2','r3'),c('c1','c2','c3','c4')))
#显示矩阵维度
dim(mat1)
#显示对象结构
str(mat1)
#显示对象中各个成分的名称
names(mat1)<-c('stupid','smart')
names(mat1)
#按列合并对象
cbind(a1,a2)
#按行合并对象
rbind(a1,a2)
#显示当前对象列表
ls()
#列出对象开始部分
head(mat1)
#列出对象结束部分
tail(a1)

  

原文地址:https://www.cnblogs.com/vincentcheng/p/7874630.html