2021-06-25
對于QIIME 2云分析,我們悉心整理了各個分析模塊中的熱點分析內容,推出了“5分鐘小課堂系列”(點擊查看)。今天開始,我們將帶來微生物組研究中的熱門分析方法——關聯網絡分析的講解,帶您從入門走向精通!
提到關聯網絡分析,大家首先想到的,可能只是一張張網絡圖,比如:
實際上,網絡圖確實是關聯網絡分析結果的一種直觀展示形式,也是在論文中“出鏡率”較高的。但是,網絡圖展示了關聯網絡分析得到的一部分內容,相當于“門面”,看上去比較酷炫,實則背后還有很多信息量有待深入挖掘哦!
知識點1
什么是關聯網絡分析?
關聯網絡分析主要用于尋找特定微生物群落在時空變化,環境過程驅動下所呈現的共現(Co-occurrence)或互斥(Co-exclusion)的固有模式,從而分析環境差異或實驗處理是否導致了群落物種裝配的差異,探究微生物群落中是否存在特定的模塊單元(Module)以完成特定的生態功能,并據此尋找足以撬動整個群落的組成變化的關鍵物種(Hubs或keystone species)。
知識點2
什么是模塊單元(Module)?
模塊單元是指在網絡中,相較于其余節點,關系更緊密復雜的節點相互之間組成的一系列結構,通常認為,同一模塊的微生物在生存或功能上關系可能更緊密。
關聯網絡分析主要涉及5個環節:
1. 構建關聯網絡
2. 繪制關聯網絡
3. 計算拓撲指數
4. 評估度分布模式
5. ZiPi分析——關鍵物種查找
今天,我們先來講解關聯網絡的構建和繪制,即識別微生物之間的相互關系,篩選可靠的相關性結果。
1. 構建關聯網絡
在關聯網絡的構建上,我們選用目前公認的成熟的SparCC算法(SparCC優于Spearman、Pearson等簡單計算相關性的算法,更適合生態學數據),根據微生物群落的組成數據,計算群落成員之間的相關性。但初步的計算結果中,往往會有一些隨機噪聲干擾,阻礙我們挖掘有生物學意義的相關值,因此,初步的相關性結果需要經過篩選,將有生物學意義的相關性篩選出來。為達成這一目的,我們選用隨機矩陣理論(RMT)來確定相關性閾值,結果如下圖:
圖中,X軸代表相關性閾值(r),y軸代表卡方檢驗值(P),豎線與X軸的交叉處,即篩選得到的相關性閾值。比如上圖,后續構建相關性網絡,便篩選相關性系數(r)絕對值在0.625以上的相關性進行繪圖(若圖中沒有豎線,則以第一個低于虛線的點為閾值,虛線優先級:藍線>紅線>綠線;若既沒有豎線,也沒有低于虛線的值,則以0.6為閾值)。
2. 繪制關聯網絡
根據第一步篩選后的相關性數據,我們就能繪制關聯網絡圖啦~繪制成功的示例圖說明如下:
默認情況下,基因云中的關聯網絡圖是基于豐度前100的ASV或OTU繪制的,如果想掌握更完整的關聯分析結果,可以將分析設置 | 豐度數目的數值調大。比如,上述例圖展示的,便是豐度數目調大至1000的結果。
另外,網絡圖的顏色、注釋方式等都可以在圖表調整部分進行修改哦~我們還可以將上述按照模塊單元來展示的網絡圖,改變為按照物種組成或分組來著色、注釋和展示~
按門水平物種著色和注釋的關聯網絡圖,注意節點和邊的關系是不會改變的
按分組著色和注釋的關聯網絡圖,注意節點和邊的關系是不會改變的
如果想要自行繪制更加個性化的關聯網絡圖,也可以通過基因云下載gml文件,導入gephi或Cytoscape軟件中,按照需要自行繪制。
關聯網絡圖繪制成功后,我們根據圖中展示的內容,即可分析整個微生物群落中的成員互作關系。比如,根據模塊化著色的網絡圖結果,可探究微生物類群間是否存在特定的模塊單元能完成特定的生態功能;根據物種著色的網絡圖,可用于分析具有相關性的物種主要屬于哪些分類單元等等。
以上就是本次的QIIME 2云分析內容講解哦,下次我們將繼續帶來網絡拓撲指數的講解,敬請關注哦!我們也衷心歡迎大家進入派森諾基因云嘗試使用哦!