R 列,某行,操作

导入数据,观察数据,操作数据,可视化展示,关闭数据

data<-read.csv("xx.csv",header=1)#第一行是header,不是值 

在读取数据时候,较有用的参数还有stringsasfactor=Fasle,这样就不会把所有的字符型变量转换成Factor因子。因子是不能用与字符串操作的,如分割字符串strsplit()

head(data) #观察数据

rownames(data)=data$memberid #把meberid列作为每行的索引key

R 对$,和[]引用方式是不同的, 方括号内逗号前指行,逗号后指列

 列名,index索引一个意思

取列:

d$列名

d[,列名]

不建议d[[第几列]]  

数据框d按第三列height列排序。列名是height

d[order(d$height),] 或

d[order(d[,3]),]

d[order(d[,3])][,c(1,3,6)] #数据框按第三列排序后,只列出1,3,6列

R 选择某写行观测值组成子数据框,这行的在某列值是95

d[d$value="95",]

操作列的时候建议加上,drop=False 防止字符串转为因子 

取前两列d[1:2]

取第三行,5、6列 d[3:3,5:6]

取特定id的某列值 data["20211105","paymoney"]

取paymoney最大的行data[which.max(data$paymoney),]

最小的 which.min

取行:

d[1:2,]前两行

按行索引key取行data["20211105",]

取多行

data[c("20211105","20211104"),]

本文来自博客园,作者:BioinformaticsMaster,转载请注明原文链接:https://www.cnblogs.com/koujiaodahan/p/15512824.html

原文地址:https://www.cnblogs.com/koujiaodahan/p/15512824.html