我的SAS菜鸟之路6

---------------------------相关性分析-------------------------------

定量资料的相关性分析

  • 可以是线性,也可以是非线性

    • 正态分布
      • Pearman相关系数
    • 偏态分布
      • Spearman相关系数
        • 分别对Xi和Yi进行编秩
  • Proc corr <选项>;

  • Pearson 该选项要求输出Pearson相关系数,也是程序默认的输出结果
    Spearman 该选项要求输出Spearman相关系数
    Fisher 输出相关系数的可信区间
  • Var变量1变2 …;

  • Partial 变量1 变量2 …;用于偏相关,控制协变量(比较纯的相关系数,得出的结果为偏相关系数)

  • Run

绘制散点图

  • proce corre plots=matrix(histogram)

    • histogram 为在散点图中加不加直方图,有则加无则不加

分类变量的关联性分析

  • 无序非配对资料

    • pearson列联系数,r
    • phi系数
    • Cramer V系数
  • 配对资料

    • Kappa系数
  • Proc freq <选项>;

  • Table 行 / <选项>;

    • chisq 可输出Pearson χ2检验、似然比检验、Mantel-Haenszel检验、phi系数、列联系数等值。 四格表还可输出连续校正χ2检验和Fisher确切检验
      trend 输出趋势检验结果,仅限于2×C表或R×2表
      agree 用于配对检验,可输出一致性系数。对四格表还给出McNemar配对检验结果,对R×R表给出Boeker对称性检验结果
      nopercent 不显示总数的百分比
      norow 不显示行合计的百分比
      nocol 不显示列合计的百分比
      exected 显示理论数
      fisher 输出Fisher确切概率
  • Test 统计量关键字;

    • kappa 对一致性系数(Kappa系数)进行统计学检验
      measures 对tabled语句中measures选项输出的所有关联系数进行检验
      pcorr 对Pearson相关系数进行检验
      scorr 对Spearman相关系数进行检验
  • Weight 权重变量;

  • By 分层变量;

  • Run;

    有序资料

  • spearman相关系数

    • proc corr spearman;

      var a b;

      freq f;

      run;

      -----------------------------------------总结 -------------------------------------------------

      方法选择:

      • 对于定量资料,如果数据符合正态分布,可以采用Pearson相关分析,如果资料不服从正态分布,可采用Spearman相关分析。三个及以上的变量分析,可采用偏相关,以校正混杂因素的影响。

      • 对于定性资料,如果数据为非配对资料,可采用perason、phi系数、Cramer系数等表示相关性。如果是配对资料,还可采用Kappa一致性检验

      • 如果相关系数很小,P值提示无统计学意义,结论只能说“无线性相关”,但不能说“无相关性”

    分类资料的关联性和一致性的区别

    • 一致性主要用于两种属性同时作用于同一批数据,如两位专家同时对同一个人打分,两种方法同时对一批样品检测等

    • 关联性所用的场合要宽泛一些,基本上可以用于任意两个属性之间的关联性表示,包括一致性所用的情形。如某指标的阴性阳性与疾病发生与否的关系、两种基因型的关系等。

    • 一般来讲,强的一致性会出现强的关联性,而强的关联性则不一定出现强的一致性。

原文地址:https://www.cnblogs.com/yangzilaing/p/13145054.html