config.yaml 3.0 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115
  1. #######################
  2. # globe
  3. #######################
  4. PEAKSNAKE_HOME: /home/zhxd/workspace/20231225_ChIP_ATAC/PeakSnake
  5. genome: ref/genome.fa
  6. gtf: ref/genes_longest.gtf
  7. tss_tes_bed: ref/genes_longest.bed6
  8. tss_tes_shuffle_bed: ref/genes_shuffle.bed6
  9. seq_type: PE # 或者 "PE"
  10. peak_type: broad # narrow | broad
  11. # 有效基因组大小, 参考 https://deeptools.readthedocs.io/en/develop/content/feature/effectiveGenomeSize.html#effective-genome-size
  12. gsize: 119481543
  13. # idr: 只支持 2 重复,适合 narrowPeak) ; intersect (2 + 重复 ) ; norep: 没有重复
  14. peak_selection: intersect
  15. #######################
  16. # samples
  17. #######################
  18. samples:
  19. bZIP11_CHXDEX_rep1:
  20. bZIP11_CHXDEX_rep2:
  21. bZIP11_CHXMOCK_rep1:
  22. bZIP11_CHXMOCK_rep2:
  23. WT_CHXDEX_rep1:
  24. WT_CHXDEX_rep2:
  25. contrasts:
  26. - bZIP11_CHXDEX_vs_bZIP11_CHXMOCK
  27. - bZIP11_CHXDEX_vs_WT_CHXDEX
  28. #######################
  29. # fastp
  30. #######################
  31. fastp: "--adapter_sequence AGATCGGAAGAGCACACGTCTGAACTCCAGTCA --adapter_sequence_r2 AGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT --qualified_quality_phred 20 --length_required 50"
  32. #######################
  33. # bowtie2
  34. # PE 建议设置 --no-mixed --no-discordant, 只保留成对比对
  35. # ATAC-seq 必须设置 --maxins 1000 ~ 2000
  36. #######################
  37. bowtie2_index: ref/genome # 不设置则从genome.fa 构建
  38. bowtie2: --no-mixed --no-discordant --maxins 1000
  39. #######################
  40. # alignmentSieve
  41. # blackregion: 黑名单区域 线粒体 叶绿体 大肠杆菌等
  42. # ATAC-seq 在 extra 中添加 --ATACshift
  43. #######################
  44. alignmentSieve:
  45. minMappingQuality: 25
  46. blacklist: ref/blacklist.bed
  47. extra:
  48. #######################
  49. # bam to bw
  50. #######################
  51. bamCoverage: "--binSize 50 --normalizeUsing RPKM"
  52. #######################
  53. # MACS3
  54. # fold: 用于过滤 peaks
  55. # qscore: 用于过滤 peaks
  56. # macs3 callpeak ChIP-seq 一般不需要设置特殊参数
  57. # ATAC-seq 推荐: --nomodel --shift -100 --extsize 200 或 --nomodel --shift -75 --extsize 150
  58. #######################
  59. macs3:
  60. qscore: 3
  61. extra: --nomodel --shift -100 --extsize 200
  62. #######################
  63. # replicate intersect
  64. #######################
  65. intersect:
  66. min_overlap: 0.5
  67. #######################
  68. # IDR
  69. #######################
  70. idr:
  71. idr_threshold: 0.05
  72. #######################
  73. # 提取序列用于 motif 分析
  74. #######################
  75. motif:
  76. top_n: 1000
  77. summit_flank: 50
  78. #######################
  79. # Peank 注释
  80. # 只关注 TSS 附近 用 ChIPseeker
  81. # 否则UROPA
  82. #######################
  83. uropa:
  84. do: yes
  85. feature: ['gene']
  86. feature_anchor: ['start', 'center', 'end']
  87. relative_location: ['Upstream', 'Downstream', 'OverlapStart', 'OverlapEnd','PeakInsideFeature', 'FeatureInsidePeak']
  88. distance: [100000, 100000]
  89. #######################
  90. # diff analysis
  91. #######################
  92. diff_peaks:
  93. do: yes
  94. method: edgeR # edgeR | DESeq2
  95. padj: 0.05
  96. #######################
  97. # cross correlation
  98. # ChIP-seq 需要进行, ATAC-seq 不需要
  99. #######################
  100. cross_correlation:
  101. do: no
  102. spp: "-s=0:5:500"