config.yaml 3.2 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118
  1. #######################
  2. # globe
  3. #######################
  4. PEAKSNAKE_HOME: /home/zhxd/workspace/20231225_ChIP_ATAC/PeakSnake
  5. genome: ref/hg38.fa
  6. gtf: ref/genes_longest.gtf
  7. tss_tes_bed: ref/genes_longest.bed6
  8. tss_tes_shuffle_bed: ref/genes_shuffle.bed6
  9. seq_type: PE # 或者 "PE"
  10. peak_type: broad # narrow | broad
  11. # 有效基因组大小, 参考 https://deeptools.readthedocs.io/en/develop/content/feature/effectiveGenomeSize.html#effective-genome-size
  12. gsize: 2913022398
  13. # idr: 只支持 2 重复,适合 narrowPeak) ; intersect (2 + 重复 ) ; norep: 没有重复
  14. peak_selection: norep
  15. #######################
  16. # samples
  17. #######################
  18. samples:
  19. Diabetic_hs_rep1:
  20. Healthy_hs_rep1:
  21. contrasts:
  22. - Diabetic_hs_vs_Healthy_hs
  23. #######################
  24. # fastp
  25. #######################
  26. fastp: "--adapter_sequence AGATCGGAAGAGCACACGTCTGAACTCCAGTCA --adapter_sequence_r2 AGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT --qualified_quality_phred 20 --length_required 50"
  27. #######################
  28. # bowtie2
  29. # PE 建议设置 --no-mixed --no-discordant, 只保留成对比对
  30. # ATAC-seq 必须设置 --maxins 1000 ~ 2000
  31. #######################
  32. bowtie2_index: ref/genome # 不设置则从genome.fa 构建
  33. bowtie2: --no-mixed --no-discordant --maxins 1000
  34. #######################
  35. # alignmentSieve
  36. # blackregion: 黑名单区域 线粒体 叶绿体 大肠杆菌等
  37. #######################
  38. alignmentSieve:
  39. minMappingQuality: 25
  40. blacklist: ref/hg38.blacklist.bed
  41. extra:
  42. #######################
  43. # bam to bw
  44. #######################
  45. bamCoverage: "--binSize 10 --normalizeUsing RPKM"
  46. #######################
  47. # MACS3
  48. # fold: 用于过滤 peaks
  49. # qscore: 用于过滤 peaks
  50. # macs3 callpeak ChIP-seq 一般不需要设置特殊参数
  51. # ATAC-seq 推荐: --nomodel --shift -100 --extsize 200 或 --nomodel --shift -75 --extsize 150
  52. # --SPMR -B 用于生成单碱基的 bdg 文件, 可以转换为 bw 文件,有可视化的需求可以加
  53. #######################
  54. macs3:
  55. qscore: 3
  56. extra: --nomodel --shift -100 --extsize 200 --SPMR -B
  57. #######################
  58. # replicate intersect
  59. #######################
  60. intersect:
  61. min_overlap: 0.5
  62. #######################
  63. # IDR
  64. #######################
  65. idr:
  66. idr_threshold: 0.05
  67. #######################
  68. # 提取序列用于 motif 分析
  69. #######################
  70. motif:
  71. top_n: 1000
  72. summit_flank: 50
  73. databases: motif_databases/HUMAN/HOCOMOCOv11_core_HUMAN_mono_meme_format.meme
  74. #######################
  75. # Peank 注释
  76. # 只关注 TSS 附近 用 ChIPseeker
  77. # 否则UROPA
  78. #######################
  79. uropa:
  80. do: yes
  81. feature: ['gene']
  82. feature_anchor: ['start']
  83. relative_location: ['Upstream', 'Downstream', 'OverlapStart', 'OverlapEnd','PeakInsideFeature', 'FeatureInsidePeak']
  84. distance: [2000, 500]
  85. #######################
  86. # footprinting
  87. #######################
  88. footprint:
  89. do: yes
  90. motif: motif_databases/HUMAN/HOCOMOCOv11_core_HUMAN_mono_meme_format.meme
  91. #######################
  92. # diff analysis
  93. #######################
  94. diff_peaks:
  95. do: yes
  96. method: edgeR # edgeR | DESeq2
  97. padj: 0.05
  98. extra: --dispersion 0.1
  99. #######################
  100. # cross correlation
  101. # ChIP-seq 需要进行, ATAC-seq 不需要
  102. #######################
  103. cross_correlation:
  104. do: no
  105. spp: "-s=0:5:500"