多组学研究文献

ChIP-seq与RNA-seq联手挖掘水稻耐旱因子

水稻基因组数据

#1.水稻MSU版本的数据库(2011年最后一次更新,已经很旧了)
http://rice.uga.edu/

wget -c http://rice.uga.edu/pub/data/Eukaryotic_Projects/o_sativa/annotation_dbs/pseudomolecules/version_7.0/all.dir/all.con #参考基因组
wget -c http://rice.uga.edu/pub/data/Eukaryotic_Projects/o_sativa/annotation_dbs/pseudomolecules/version_7.0/all.dir/all.gff3 #注释文件

FASTQC

一般而言RNA-Seq数据在sequence duplication levels 未通过是比较正常的。毕竟一个基因会大量表达,会测到很多遍。
Per Sequence GC Content,统计reads的平均GC含量的分布。红线是实际情况,蓝线是理论分布(正态分布,均值不一定在50%,而是由平均GC含量推断的)。曲线形状的偏差往往是由于文库的污染或是部分reads构成的子集有偏差(overrepresented reads)。偏离理论分布的reads超过15%时,报"WARN";偏离理论分布的reads超过30%时,报"FAIL"。当红色的线出现双峰,基本肯定是混入了其他物种的DNA序列
一个fastqc参数介绍

猜你喜欢

转载自blog.csdn.net/geekfocus/article/details/120002397
今日推荐