R

结果重用:一个函数的输出,作为其他函数的输入

利用一个已经安装好的数据集(mtcars,car包中的?)作为例子,来展示一下

head(mtcars),输出数据集中的前6条数据  

我们暂时关注两个字段,mpg:1加仑汽油汽车可以行驶的举例,wt:汽车的重量

做一个简单的线性回归,看车身重量,和每加仑汽油所能行驶的公里数,它们之间的关系   lm(),得到的结果相关度是一个负值,表示是负相关的

上面执行的时候,只会在屏幕上打印,结果不会保存,下面我们重新执行一遍该函数,把结果保存在一个变量中,名为result

 对结果result进行重用

或者在画图中,进行重用

 R的所有操作都是基于内存的,就是说在做操作的时候,需要先把数据导入到内存中,然后再进行处理,如果对于很大的数据集,比如TB,那么很显然一般的电脑不具备这么大的内存,这就给R带来了很大的不方便,但是还是能够处理大数据集的。

 R处理大数据集有两种方式:

1.使用专门用于处理大数据的分析包,比如lm()函数是用来做线性拟合的函数,而要是做大数据的线性拟合,则使用bigln()

2.与大数据处理平台的结合。R有相关的接口可以和Hadoop、Hive等进行整合

原文地址:https://www.cnblogs.com/mrxiaohe/p/6734479.html