CHIP-SEQ 芯片分析时,对于来自重复实验的数据,怎样进行MACS peaks calling 分析?

解决方法:

将bowtie得到的bam文件,转换为bed文件,并使用cat指令,将其所有重复实验文件合并,将合并文件作为输入文件,进行peaks calling。

参考链接:MACS官网

http://liulab.dfci.harvard.edu/MACS/00README.html

Notes:

3) For the experiment with several replicates, it is recommended to concatenate several ChIP-seq treatment files into a single file. To do this, under Unix/Mac or Cygwin (for windows OS), type:

$ cat replicate1.bed replicate2.bed replicate3.bed > all_replicates.bed

附录:

我的数据

数据简介
样本 数据
重复样本1 SRR6168965
重复样本2 SRR6168971
重复样本3 SRR6168972

过程代码

(base) s45@HP45:~/chip-seq_analysis/1-bowtie/2-lung$ bamToBed -i SRR6168965.bam >SRR6168965.bed
(base) s45@HP45:~/chip-seq_analysis/1-bowtie/2-lung$ bamToBed -i SRR6168971.bam >SRR6168971.bed
(base) s45@HP45:~/chip-seq_analysis/1-bowtie/2-lung$ bamToBed -i SRR6168972.bam >SRR6168972.bed
(base) s45@HP45:~/chip-seq_analysis/1-bowtie/2-lung$ cat SRR6168965.bed SRR6168971.bed SRR6168972.bed >lung_all.bed

lung_all.bed是最终三个样本数据合并的文件。

MACS分析指令:

(base) s45@HP45:~/chip-seq_analysis/2-macs2_change$ macs2 callpeak -t /home/s45/chip-seq_analysis/1-bowtie/2-lung/lung_all.bed -f BED -g mm -n  lung_all -B -p 0.0001 --outdir /home/s45/chip-seq_analysis/2-macs2_change/

但是,后来实践发现,以上方法分析得到的peaks序列与原文献数量相比,大大增加,原因不明。

觉得不对。

后来发现一篇博文,解决了我的疑惑,请有相同疑惑的同学可以参考:

参考链接(https://www.jianshu.com/p/d8a7056b4294)使用bedtools取共有的overlap区,猜得到与文献相似的结果。猜想这是合适的对于重复样本取overlap的方式。

猜你喜欢

转载自blog.csdn.net/weixin_40640700/article/details/102390006