互信息应用于SNP特征选择的局限

互信息已广泛应用于特征选择问题,但应用在 SNP 选择上还存在着一些局限。
第一,互信息只能衡量一个 SNP 组合与表型的相关性, 无法衡量多个 SNP 与表型的相关性。
第二, 利用互信息排序 SNP 时,隐含着一个假设,即: SNP 间是相互独立的,不存在着依赖关系。然而事实上,SNP 间存在着广泛的交互作用。因此,互信息排序 SNP 会严重低估交互作用 SNP 的重要性。
第三,利用互信息选择 SNP 组合时,任意加入一个新 SNP 都会使互信息值不小于加入前该 SNP 组合的互信息值,限制了不同维度 SNP 组合间的比较。

原文地址:https://www.cnblogs.com/Acceptyly/p/3890591.html