R 基础入门

R 语言基础 :统计分析、数据处理、作图。
免费开源,兼容多操作系统。数据处理包丰富。合格的分析。
下载地址 https://cran.r-project.org/bin/windows/base/
赋值符: <-
x <- rnorm(5)

或rnorm(5) ->x

工作空间是R的当前工作环境
帮助系统:
Rseek、Bioconductor、统计之都论坛...
RStudio 安装

R包是函数的集合。
包来源并安装:
1.CRAN
install packages
2.Bioconducor
source("https://bioconductor.org/bioLite.R")
biocLite("包名")
3.github

调用包 :library("包名")

R语法
1. R对象:R的所有变量、数据、函数及结果都以对象形式存在活动内存中,并有相应的名字对应。
对象的属性:类型class、模式mode即元素类型、长度length即元素个数
2. 运算符
赋值 x<-6
6->x
+-*/
比较运算 ><
逻辑运算 x&y x&&y
提示符:
> 命令或运算提示符
+ 续行符
求助符 ? / ?? help的意思
注释 #
退出R q()

?函数名:帮助文档
1. 函数名 包
2.函数功能描述
3.函数调用方法
4.参数说明
5.补充说明
6.其他类似信息
7.使用例子 #非常有助于理解
3.R的数据结构
3.1特殊变量
NA 一般的缺失值
NaN 运算产生的缺失值,如对负数求对数
缺失值检验:
is.na()
is.nan()
正无穷大 如被除0 :lnf
负无穷大 -lnf
无穷大检验:
is.finite(x)
is.infinite(x)
3.2 常用的数据结构及其类型
3.1向量:数值型,字符型,复数型,逻辑型
一个向量中元素值的类型(模式)必须相同
数值型:整型、单精度实型、双进度实型
逻辑型 TRUE FALSE
复值型
字符型
构建向量 seq()起始、终止、步长
: 1为步长
rep() 重复
c() 字符串向量
scan()
sequence()
paste()字符串向量
factor()
向量子集提取 注:下标从1开始 x=c(42,1,2,3)
正的下标 提取对应的元素 x[1]
负的 去掉 元素 x[-2]
逻辑运算 提出满足条件的元素 x[c(1,4)]
3.2数组 维数>=1的数据表:矩阵式数组的一个特例:维数=2
属性: 模式、长度、维度(dim)
条件:数组所有元素都是同一模式(都是数值或字符)
数组构建 array
矩阵建立 matrix(data=NA,nrow=1,ncol=1,byrow=FALSE,dimnames=NULL)
矩阵 取j列 A[,j]
取i行 A[i,]
A[i,j] 取第i行第j列
A[-i,] 取出除第i行以外的所有元素
A[,-j] 取出除第j列以外的所有元素
3.3数据框 是推广了的矩阵
每一列的数据是同一模式,且长度要相等。
构建数据框 data.frame()
x y 是向量。 INDEX=x,VALUE=y
从文件读取数据 即使数据框结构
数据框子集提取 foo[row,column] 除行列数外提取外,也可根据列名字 即INDEX 这样的提取。

3.4 列表
包含任何类型的对象
foo=list(x=1:6,y=matrix(1:4,nrow=2))
列表子集的提取
foo$x 提取x元素
foo[1] 索引位

a$p.value
3.5 因子 对等长的其他向量元素进行分类(分组)的向量对象,是类型变量。分为有序和无序
作用是分类,应用于统计建模
属性:
水平:因子可能的取值集合
factor()构建因子
调整图坐标顺序 a$time<-factor(a$Time,...)
4.程序设计
函数名 、参数列表、函数体、返回值
4.1 条件
1.if (条件)表达式1 else 表达式2
2. ifelse(条件,yes,no)

4.2 循环
for while repeat
向量化
4.3 文件操作
创建 文件显示和编辑 ...
setwd()
dir()显示当前目录的文件
4.4 程序运行
在R内 source("fun.R")
在命令行 Rscript

第三部分 数据处理 基本统计分析

1. 数据浏览
查看所有数据 mtcars ls()
部分数据 head(mecars) tail(mtcars)
str(mecars) 结构化显示内容
ls.str()
View(a)

library(dplyr)

2数据编辑
data.entry(mecars)
rm(x)
a[5]<-7
3.数据转换
类型检测 is.list, is.factor, ...
类型转换 as.data.frame ,...
4.数据读取
4.1 读取向量和矩阵 scan()
4.2 读数据框 read.table() #读取混合模式列表数据 ,最常用
read.table(file,
header=FALSE,
sep='''' #列分隔符
...)
如:
a<-read.table("mascot.txt",head=T,sep=" ")
str(a)
5.数据存储
5.1保存为R二进制格式
save.image()
write.table() #最常用
write.table(x,
file=""
append=FALSE,
quote=FALSE
)
常见数据处理
函数 :log(自然对数),exp(指数函数),log10.sin 。。。

向量运算 如某列操作
。向量操作是每个元素加减乘除
汇总及排序
汇总:table cut unique duplicated
table(a$charge) #charge 是a的一列 ,统计个数
数据整合 合并:merge cbind rbind
merge #两个表按共有字段合并
集合运算 %in%
union(x,y)
intersect(x,y)

向量化计算 核心是循环计算
对矩阵或数据框的行或列指定操作
apply(X,Dimcode,FUN,...)
apply(x,2,mean) 按x列求均值
apply(x,1,mean) 按x行求均值
对象每个元素操作
sapply lapply
tapply
5.基本统计分析
样本均值...
sample 随机抽样
概率分布 dfunc ...
假设检验 T检验....

6. R绘图
读数据 -数据处理-绘图-图形输出
1.绘图函数
1.1 高级绘图函数 创建一个新的图形
1.2 低级绘图函数 在现有图形基础上画
实践 改参数 观察图形变化。
help(par)
颜色 :1,2,3,4,5 ,6 ,7 ,8
颜色函数
线的类型
画图面板分割
par(mfrow=c(2,2))
layout
图形边距设置 par(mar=c(5,4,4,2)+0.1)
图形保存
pdf("plot.pdf",...)
png()
dev.off()
通过菜单提示也可以保存。

本文来自博客园,作者:BioinformaticsMaster,转载请注明原文链接:https://www.cnblogs.com/koujiaodahan/p/14594048.html

原文地址:https://www.cnblogs.com/koujiaodahan/p/14594048.html