config.yaml 2.9 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112
  1. #######################
  2. # globe
  3. #######################
  4. PEAKSNAKE_HOME: /home/zhxd/workspace/20231225_ChIP_ATAC/PeakSnake
  5. genome: ref/genome.fa
  6. gtf: ref/genes_longest.gtf
  7. tss_tes_bed: ref/genes_longest.bed6
  8. tss_tes_shuffle_bed: ref/genes_shuffle.bed6
  9. seq_type: SE # 或者 "PE"
  10. peak_type: narrow # narrow | broad
  11. # 有效基因组大小, 参考 https://deeptools.readthedocs.io/en/develop/content/feature/effectiveGenomeSize.html#effective-genome-size
  12. gsize: 119481543
  13. # idr: 只支持 2 重复,适合 narrowPeak) ; intersect (2 + 重复 ) ; norep: 没有重复
  14. peak_selection: idr
  15. #######################
  16. # samples
  17. #######################
  18. samples:
  19. ZAT6_ABA_rep1: Col0_mock_rep1
  20. ZAT6_ABA_rep2: Col0_mock_rep2
  21. H3K4me3_WT_rep1: Input_WT_rep1
  22. H3K4me3_WT_rep2: Input_WT_rep1
  23. contrasts:
  24. - ZAT6_ABA_vs_H3K4me3_WT
  25. #######################
  26. # fastp
  27. #######################
  28. fastp: "--adapter_sequence AGATCGGAAGAGCACACGTCTGAACTCCAGTCA --adapter_sequence_r2 AGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT --qualified_quality_phred 20 --length_required 50"
  29. #######################
  30. # bowtie2
  31. # PE 建议设置 --no-mixed --no-discordant, 只保留成对比对
  32. # ATAC-seq 必须设置 --maxins 1000 ~ 2000
  33. #######################
  34. bowtie2_index: ref/genome # 不设置则从genome.fa 构建
  35. bowtie2:
  36. #######################
  37. # alignmentSieve
  38. # blackregion: 黑名单区域 线粒体 叶绿体 大肠杆菌等
  39. # ATAC-seq 在 extra 中添加 --ATACshift
  40. #######################
  41. alignmentSieve:
  42. minMappingQuality: 25
  43. blacklist: ref/blacklist.bed
  44. extra:
  45. #######################
  46. # bam to bw
  47. #######################
  48. bamCoverage: "--binSize 50 --normalizeUsing RPKM"
  49. #######################
  50. # MACS3
  51. # fold: 用于过滤 peaks
  52. # qscore: 用于过滤 peaks
  53. # macs3 callpeak ChIP-seq 一般不需要设置特殊参数
  54. # ATAC-seq 推荐: --nomodel --shift -100 --extsize 200 或 --nomodel --shift -75 --extsize 150
  55. #######################
  56. macs3:
  57. qscore: 3
  58. extra:
  59. #######################
  60. # replicate intersect
  61. #######################
  62. intersect:
  63. min_overlap: 0.5
  64. #######################
  65. # IDR
  66. #######################
  67. idr:
  68. idr_threshold: 0.05
  69. #######################
  70. # 提取序列用于 motif 分析
  71. #######################
  72. motif:
  73. top_n: 1000
  74. summit_flank: 50
  75. #######################
  76. # Peank 注释
  77. # 只关注 TSS 附近 用 ChIPseeker
  78. # 否则UROPA
  79. #######################
  80. uropa:
  81. do: yes
  82. feature: ['gene']
  83. feature_anchor: ['start'] # ['start', 'center', 'end']
  84. relative_location: ['Upstream', 'OverlapStart'] # ['Upstream', 'Downstream', 'OverlapStart', 'OverlapEnd','PeakInsideFeature', 'FeatureInsidePeak']
  85. distance: [5000, 5000]
  86. #######################
  87. # diff analysis
  88. #######################
  89. diff_peaks:
  90. do: yes
  91. method: edgeR # edgeR | DESeq2
  92. padj: 0.05
  93. #######################
  94. # cross correlation
  95. # ChIP-seq 需要进行, ATAC-seq 不需要
  96. #######################
  97. cross_correlation:
  98. do: yes
  99. spp: "-s=0:5:500"