染色质可及性数据学习

1.染色质开放性测试技术

https://zhuanlan.zhihu.com/p/31924355

首先正常的DNA都是卷起来的,只有在表达时才会展开,也就是开放,术语上说就是具有可接近性,那么ATAC-seq就是测这些染色质开放性的技术。

原理:

人为地将这些DNA序列标签的转座复合物加入到细胞核中,再利用已知序列的标签进行PCR后测序,就知道哪些区域是开放染色质了。

因为插入的这些转座复合物是有颜色的,红蓝颜色,结合后就可以测序测出来的。

“开放染色质具有转座酶敏感性,转座酶能够随机插入到不受保护的DNA序列上(类似DNase),但转座酶不像限制性内切酶那样能够切割DNA。”

从上面这句话可以看出,ATAC测的就是不受保护的DNA片段,但是这个DNA片段如何与基因对应是未知的。

2.问题

1.染色质和基因的大小关系

 染色质包含DNA,有效的DNA片段是基因。

http://www.ynzhongdun.com/blog/dna-279ed9bd-49fa-4b98-ac71-581a3d763850

 2.motifs是什么:

https://wenlongshen.github.io/2017/01/22/DNA-Motif/

从这篇文章的理解,motifs就是转录因子的结合位点,它标示着结合的位置。

motifs是一个重复的pattern,序列基序,结构基序或网络基序。 

https://zhuanlan.zhihu.com/p/93147239

从这篇文章中:

 motifs的位置是和转录相关的。

3.call peak

https://www.jianshu.com/p/b272c846ef28 从这里大约可以看出peak就相当于counts吧,也是一个量化的值,

call peak我个人就理解为像找到scRNA-seq的counts矩阵这样。

4.scATAC-seq和scRNA -seq如何产生对应关系

从上面的链接中:

转到问题6.

再转到5.

5.基因活跃矩阵是什么?

http://xuzhougeng.top/archives/Analysis-scATAC-seq-with-scRNA-seq-in-Seurat

即两者产生关系就是通过将ATAC转换为基因表达活跃度矩阵来实现的。 

6.什么是转录因子(Transcription factor,TF)?

https://www.cnblogs.com/wangprince2017/p/9813731.html

转录因子是一种蛋白质,它含有一个或多个DNA结合位点,可以和DNA结合,之后DNA才可进行转录工作,控制着基因的表达。

7.batcode与cell

https://zhuanlan.zhihu.com/p/98877540

从这篇文章中可以看出,barcode代表着cell,但可能代表不止一个cell。

原文地址:https://www.cnblogs.com/BlueBlueSea/p/12402593.html