RNA-seq操作实战

1.参考流程:https://mp.weixin.qq.com/s?__biz=MzI1MjU5MjMzNA==&mid=2247484466&idx=1&sn=24b0bbb405afd1b5deec696811c116ef&chksm=e9e02d93de97a4859122c4cff5d3b30de59c2f89cc4267b737a410642177a21b3c09f48e4155&scene=21#wechat_redirect

参考文献:

A survey of best practices for RNA-seq data analysis

Gaining comprehensive biological insight into the transcriptome by performing a broad-spectrum RNA-seq analysis

2.根据上述网站,自己实战的一些情况;关于软件的安装这块,经过自己的填坑经验,建议大家使用

bioconda来安装相应的生物学软件。(bioconda的使用参见网站:https://zhuanlan.zhihu.com/p/25085567   以及 http://python.jobbole.com/86236/

3.根据参考文章下载相应的数据:(NCBI-GEO数据库)

4.下载参考基因组(UCSC/NCBI/)

5.数据的格式转换及fastqc质控(参考:http://www.cnblogs.com/lmt921108/p/7442617.html

6.利用HISAT2建立索引文件:hisat2-build -p 2 genome.fa genome(参考:http://blog.sciencenet.cn/blog-759995-990471.html

7.利用HISAT2进行序列比对:hisat2 -p -x genome  -1  SRR35899_1.fastq.gz  -2  SRR35899_2.fastq.gz  -S  SRR35899.sam  (我的数为双末端测序结果)

8.利用上述命令得出的结果发现:比对率很低,解决办法参考网站(https://mp.weixin.qq.com/s?__biz=MzAxMDkxODM1Ng==&mid=2247483891&idx=1&sn=b7944d4c1bd5cd651bcc4bdf92e9266b&scene=21#wechat_redirect)

该网站上有一个参数--local,本人刚开始照着做时,命令如下:

hisat2 -p -5 5 -3 10 --local  -x genome  -1  SRR35899_1.fastq.gz  -2  SRR35899_2.fastq.gz  -S  SRR35899.sam

然后程序就报错了,提示没有--local这个参数。去掉该参数重跑,OK,正确。【所以说,有时候具体问题具体分析】

原文地址:https://www.cnblogs.com/lmt921108/p/7443879.html