2020-07-06
(重要列說明,部分列隱藏)
A列:蛋白的登陸號。
B列:蛋白的全稱。
C-H列:每個樣本中蛋白相對定量的值。
蛋白組主要目的是尋找不同比較組之間的差異蛋白。差異分析一般涉及兩個標準,差異倍數(shù) fold change 和 p 值,一般認為上調(diào)或者下調(diào)在2或1.5倍以上,且同時p值小于0.05,才認為該蛋白在兩個比較組間發(fā)生了顯著的差異變化。按照這一標準篩選出來的差異蛋白即為蛋白組找到的顯著差異蛋白集。
當差異蛋白的個數(shù)太多時,可以考慮收縮篩選標準,比如調(diào)大差異倍數(shù),調(diào)小p值范圍,若差異基因個數(shù)仍然較多,可以調(diào)整為比p值更嚴格的 P adj 或者 FDR 來進行篩選;當差異蛋白的個數(shù)太少時,可以考慮放寬篩選標準,比如調(diào)小差異倍數(shù)。
1、組間差異蛋白鑒定
(重要列說明,部分列隱藏)
綠色底紋標記的是下調(diào)蛋白,上調(diào)蛋白會用紅色底紋標示
B-D列:蛋白在GO數(shù)據(jù)庫的三大功能類中的編號。
E列:蛋白在KEGG數(shù)據(jù)庫中的編號。
G-I列:蛋白質(zhì)氨基酸數(shù)目、分子量、等電點。
J列:基于相對定量結(jié)果得出的蛋白組間差異倍數(shù)。
K列:組間差異鑒定事件對應(yīng)的顯著性P值。
2、組間差異蛋白火山圖
差異蛋白火山圖
①、紅色的點為上調(diào)蛋白,藍色的點為下調(diào)蛋白,灰色點為非顯著差異蛋白。
②、橫坐標為差異倍數(shù),取log2是為了作圖的對稱性。
②、縱坐標為P值,取-log10(P value)是為了作圖的美觀性,橫向直線對應(yīng)的值為1.3,對應(yīng)P = 0.05。
3、組間差異蛋白聚類熱圖
一般熱圖都呈現(xiàn)的是雙向聚類的結(jié)果,即橫坐標對樣本聚類,縱坐標對蛋白進行聚類,表達模式相近的蛋白或者樣本會聚到一起。
①、熱圖只能做橫向比較,即比較同一個蛋白在不同樣本中表達變化,縱向沒有可比性,因為生物體內(nèi)不同蛋白豐度本身就有差異。根據(jù)圖例可知,顏色越紅表達量越高,顏色越藍表達量越低。
②、橫坐標為樣本名稱,縱坐標為蛋白名稱。
在進行蛋白質(zhì)組學研究時,我們的研究對象是細胞、組織或生物體中全部蛋白質(zhì)的集合,了解哪一些功能或生物學途徑受到生物學處理的顯著影響是首要任務(wù)。因此,需要從更為系統(tǒng)和概括的層次和角度,對所研究的蛋白及其功能進行概括和分析。GO與KEGG為基本的基因或蛋白功能富集分析,兩種分析的大部分結(jié)果圖展示形式相同,為避免重復(fù),下面的分析圖片中,相同圖形僅在GO或者KEGG部分展示。
功能富集結(jié)果挖掘建議:首先結(jié)合研究方向與表型等因素考慮,在顯著富集的通路中主觀選擇關(guān)鍵通路查看。如果沒有明確目標,可以根據(jù)顯著性排序、富集因子大小、富集蛋白數(shù)目多少等方面篩選關(guān)鍵通路,再進一步查看通路中富集的蛋白。
1、GO功能富集分析
GO(基因本體論聯(lián)合會建立的數(shù)據(jù)庫 http://geneontology.org/,Gene Ontology)是一個國際標準化的基因功能分類體系,提供了一套動態(tài)更新的標準詞匯表來全面描述生物體中基因和基因產(chǎn)物的屬性。GO 涵蓋三個方面,分別描述基因的分子功能(Molecular Function)、細胞的組件作用(Cellular Component)、參與的生物學過程(Biological Process)。GO 的基本單元是 Term,每個 Term 有一個唯一的標示符(由 “GO:” 加上 7個數(shù)字組成,例如 GO:0072669)。
①、用不同的顏色代表3個不同的GO功能大類,橫坐標為GO term名稱。
②、縱坐標為term上富集的蛋白數(shù)目以及占分析時提交總蛋白數(shù)目的百分比。
2、KEGG功能富集分析
氣泡圖也是功能富集分析中的常見展示形式。選擇顯著性排名前10或者20的通路做圖形展示。
①、左側(cè)縱坐標為通路名稱。右上方圖例為FDR值的示意,顏色越紅越顯著。右下方圖例的圓點越大表示該通路上富集的基因數(shù)目越多。
②、橫坐標為富集因子。為該通路上富集的差異蛋白占分析時該通路上提交所有蛋白個數(shù)的百分比。
每個KEGG通路都對應(yīng)了一張詳細的代謝通路圖,KEGG通路是跨物種的,分析時會結(jié)合實際樣本結(jié)果對該通路圖進行差異蛋白標注。該圖查看方式:在KEGG結(jié)果表格中打開網(wǎng)頁鏈接即可查看對應(yīng)通路的通路圖,待圖形緩沖完成,可以鼠標右擊另存為保存。差異蛋白的標注方式會有多種形式,如遇到有疑問的可就具體問題咨詢我們。
圖中以紅色框表示參與該通路的所有差異蛋白質(zhì),綠色框線表示本物種中的蛋白(KEGG是跨物種的數(shù)據(jù)庫)。小圓圈表示小分子代謝物,大圓框代表其他通路。
在生物體中,蛋白質(zhì)并不是獨立存在的,其功能的行使必須借助于其他蛋白質(zhì)的調(diào)節(jié)和介導(dǎo)。這種調(diào)節(jié)或介導(dǎo)作用的實現(xiàn)首先要求蛋白質(zhì)之間有結(jié)合作用或相互作用。對蛋白質(zhì)之間的相互作用及相互作用形成的網(wǎng)絡(luò)進行研究,對于揭示蛋白質(zhì)的功能具有重要意義。
PPI是一般是基于STRING數(shù)據(jù)庫來做的。它(http://string-db.org/)是一個搜尋已知的和基于預(yù)測的蛋白質(zhì)之間相互作用的系統(tǒng)。其中人、小鼠、大鼠、擬南芥等,可獲得的互作信息已較為完善,PPI的結(jié)果信息多,互作關(guān)系準確。但是對于參考基因組蛋白注釋不佳,尤其是無考考基因組的物種,我們需要通過尋找數(shù)據(jù)庫中的近源蛋白來做PPI,如果能對應(yīng)到的近源蛋白不多,那么PPI互作網(wǎng)絡(luò)中的蛋白則較少,且互作關(guān)系的準確性也僅供參考。
每個比較組對應(yīng)一張PPI圖,不同的圓圈代表不同的蛋白,中間有連線表明可能存在互作關(guān)系。