dplyr 数据操作 数据过滤 (filter)

在R的使用过程中我们几乎都绕不开Hadley Wickham 开发的几个包,前面说过的ggplot2、reshape2以及即将要讲的dplyr

因为这几个包可以非常轻易的使我们从复杂的数据操作中逃离,操作过程简洁,最重要的是数据结果也异常简洁。

首先我们来了解下第一个函数filter()

filter(.data, ...)

参数很简单,只有data,即要操作的数据对象,其他都是数据操作条件。

下面看一些简单的例子

library(dplyr)
x<-data.frame(id=1:6,
              name=c("wang","zhang","li","chen","zhao","song"),
              shuxue=c(89,85,68,79,96,53),
              yuwen=c(77,68,86,87,92,63))
dim(x)#查看数据行列属性

[1] 6 4  

x

 

filter(x,name=="zhang")

filter(x,shuxue>60,yuwen<90)

可以进行多条件筛选,条件可以用逗号隔开 

filter(x,shuxue>80|yuwen<80)

多条件筛选,也可以用连接符&或| 进行连接。

相对而言,filter()还是比较简单,使用过程主要还是要看个人的灵活程度。

  

原文地址:https://www.cnblogs.com/wkslearner/p/5738693.html