分析項目 | 類別 | 分析 | 備注 |
原始數據整理、過濾及質量評估 | A | √ | |
與參考基因組序列比對 | A | √ | |
Peak Calling | A | √ | |
基因附近及Peak中心信號分布圖 | A | √ | |
Peak鄰近基因功能分析 | A | √ | |
差異Peak序列Motif及注釋分析 | A | √ | |
差異Peak鄰近基因功能分析 | A | √ | |
Overlap基因功能分析 | A | √ |
Peak Calling
使用統計學方法計算出參考基因組上比對上的 Reads 顯著富集的區域(稱為 Peak),這些區域在不同的實驗中表示不同的研究重點,獲得 Peak 后,可對 Peak 進行后續的 Peak 序列 Motif 分析、 Peak 注釋等分析,進一步挖掘感興趣的方向。Peak 在外顯子、內含子、5’UTR、3’UTR、基因間區等區域上的分布情況如下:
功能性區域Peak分布
Peak序列Motif分析
轉錄因子往往傾向于結合在特定的 DNA 序列上,這些 DNA 序列通常具有高度相似的核苷酸序列模式,即每個轉錄因子都有一個目標 DNA 序列的 Motif,公開發表的轉錄因子數據庫中一般記錄了轉錄因子對應的 Motif 信息。對 Peak 序列計算 Motif,在公共數據庫中搜索這些 Motif 對應的轉錄因子,即可得到此種狀態下染色質開放區可能結合的轉錄因子。
Motif分析示意圖
Peak鄰近基因GO富集分析
統計Peak鄰近基因顯著富集的GO條目,從而展示可能被轉錄因子調控的基因功能,對每個Peak鄰近基因進行GO注釋,得到其所有的GO功能條目。
GO富集柱狀圖
差異Peak鄰近基因Pathway富集分析
統計各個KEGG Pathway上包含的差異Peak鄰近基因數目及富集程度,進而確定差異Peak鄰近基因主要參與的代謝途徑和信號通路。
KEGG富集分析
Overlap基因分析
為了研究轉錄因子/組蛋白修飾是如何調控下游基因,通常要結合表達數據 RNA-seq 分析,進一步研究轉錄因子/組蛋白修飾的調控作用,即促進或抑制基因表達。
韋恩圖