R_Studio(学生成绩)数据相关性分析

  对“Gary.csv”中的成绩数据进行统计量分析

  

  

    

  用cor函数来计算相关性,method默认参数是用pearson;并且遇到缺失值,use默认参数everything,结果会是NA

相关性分析

  当值r>1时,正相关,一个变量增加或减少时,另一个变量也相应增加或减少

  当值r=1时,无相关,说明两个变量相互独立,有一个变量值无法预测另一个变量值

  当值r<1时,负相关,一个变量增加或减少时,另一个变量也相应减少或增加

 

  相关系数取值范围限于: -1 <= r <= +1

  好严格的对称性

  如果只想看大学体育和大学英语 相关性系数

  小case!

setwd('D:\data')                            #更改工作目录
list.files()                                #列出当前工作目录下的文件
dat=read.csv(file="Gary.csv",header=TRUE) 

cor(dat)

plot(dat)

#大学体育 大学英语 相关性系数
cor(dat[,1],dat[,2])

#绘图
plot(dat[,1],dat[,2])
Gary.R

 可视化相关性分析  传送门

  [1] 使用 symnum() 函数实现可视化

  [2] 使用 corrplot() 函数实现可视化

  [3] 使用 PerformanceAnalytics 包进行可视化

  [4] heatmap 可视化

(如需转载学习,请标明出处)
原文地址:https://www.cnblogs.com/1138720556Gary/p/9652124.html