R数据处理

NA值

缺失值：就是在收集数据的时候我们没有收集到，或者因为某种原因为获得的数字，也或者是我们并不想得到这个数据

当有

> x = c(1,4,7,NA,12,19,15,21,20)
> mean(x)

> mean(x,na.rm=TRUE)
[1] 12.375

1，R中对数据进行排序的三个函数：sort()；rank()；order()

sort（）是对向量进行从小到大的排序
rank（）返回的是对向量中每个数值对应的秩
order（）返回的值表示位置，依次对应的是向量的最小值、次小值、第三小值......最大值
举例> data=c(5,6,8,2,4,9)> sort(data)
[1] 2 4 5 6 8 9> rank(data)
[1] 3 4 5 1 2 6> order(data)
[1] 4 5 1 2 3 6> data[order(data)] #等同于sort(data)
[1] 2 4 5 6 8 9

x<-matrix(sample(c(1:15,replace=T)),5,3)

对第一列进行排序

xx<-x[order(x[,1]),]即可

2，生成随机数的几个函数几个函数runif(numbers,min,max),sample(vector,nums,replace=FALSE)

x<-runif(5,4,6)

[1] 4.901935 5.949990 4.883811 4.773844 4.937902

这是返回的是4到6之间的任何数

sample(c(1:10),5,replace=T)返回的是取1到10之间的整数，可重复抽样