2021-04-02
對于QIIME 2云分析,我們悉心整理了各個分析模塊中的熱點分析內容,推出了“5分鐘小課堂系列”。此前已帶來了第1講(【派森諾基因云】5分鐘帶您看懂QIIME 2云分析 (1)點擊查看)和第2講(【派森諾基因云】5分鐘帶您看懂QIIME 2云分析:Beta多樣性篇點擊查看),對物種組成分析、Alpha多樣性分析和Beta多樣性分析進行了解讀。今天我們更進一步,幫助大家掌握物種差異分析的具體方法,找到標志物種(Biomarker)!
如前所述,Alpha/Beta多樣性分析主要用于比較各樣本/分組中,微生物群落在多樣性水平和整體結構上的差異。當我們通過Alpha多樣性指數的箱線圖分析、或是Beta多樣性的PCoA/NMDS分析,發現存在顯著的組間差異時,我們通常需要進一步關注:具體是哪些微生物物種存在組間差異呢?
這時候,我們的“物種差異與標志物種分析”,就可以大顯身手啦!
1. 韋恩圖分析
在微生物組研究中,韋恩圖通常用于分析不同的樣本(組)間有哪些物種是共有的、哪些是獨有的,在文獻中的出鏡率也非常高。云分析中,每個樣本(組)作為一個集合,根據ASV/OTU在各樣本(組)間的有無情況分別統計各個集合的成員數,也就是各個分組獨有的、以及組間共有的ASV/OTU的個數(注意不是豐度值)。
圖中,每個色塊代表一個分組,色塊間的重疊區域指示相應樣本(組)間所共有的ASV/OTU,每個區塊的數字指示該區塊所包含的ASV/OTU的數目。
此外,韋恩圖有多種展現形式,包括花瓣圖、齒輪韋恩圖等,都可以通過“圖表調整”模塊來實現圖形修改。
我們還可以對門/綱/目/科/屬等分類水平的物種組成,進行韋恩圖分析,我們此前也已做過作圖方法介紹,大家也可以參考哦(【教程分享】無需代碼,3種方法輕松get高顏值韋恩圖!點擊查看)~
2. 熱圖和隨機森林分析
熱圖是數據可視化的常用方法之一,也是挖掘多維復雜數據變化規律的重要手段。我們可以將熱圖應用于ASV/OTU、各分類水平的物種注釋結果(如門/綱/目/科/屬/種豐度組成)等各個層面的分析中,以展現各樣本(組)中物種豐度的變化規律。QIIME2云分析流程自帶“物種組成熱圖”和“隨機森林分析熱圖”,可以根據研究需要,隨心調整出圖效果:
隨機森林是一種基于決策樹(Decision tree)的高效的機器學習算法(Machine-learning methods),屬于非線性分類器(Non-linear classifier),能夠深入挖掘變量之間復雜的非線性相互依賴關系,對于經常呈現離散、不連續分布的微生物群落數據而言尤其適用。
通過隨機森林分析,我們可以篩選對組間差異具有重要影響的標志物種,默認展示的是重要度排名前20的標志物種(可以是ASV/OTU,也可以是門/綱/目/科/屬/種的分類水平)。結果圖由左右兩部分組成,左側為每個標志物種對應的豐度熱圖,而右側則是每個標志物種的重要度得分值柱狀圖,柱子越長,表明該標志物種對于組間差異影響的重要性越大;從上到下,物種對組間差異影響的重要性依次遞減。
3. PCA和OPLS-DA分析
PCA和OPLS-DA分析基于物種組成信息(門/綱/目/科/屬/種),可用于分析組間差異,并篩選潛在的標志物種。PCA和OPLS-DA的樣本排序圖與PCoA類似,也是觀察樣本在坐標軸上的投影,樣本(組)間投影越遠,則兩樣本(或分組)在該坐標軸上的差異越大。
與PCoA不同的是,PCA與OPLS-DA還提供了物種載荷圖,點擊右上角圖表切換即可獲得。物種載荷圖可用于尋找標志物種。圖中,每個點代表一個物種(默認為屬),點的橫坐標和縱坐標為該物種的VIP值(Variable importance in projection),可分別認為是該物種對樣本在這兩個維度上組間差異的貢獻大小;兩個坐標軸括號中的百分數分別為所有樣本在該維度上的組間豐度差異占總的組間差異的比值。橫縱坐標軸的絕對值越大的物種越關鍵,可關注。
除了上述標志物種的分析篩選方法,我們還可以使用LEfSe和MetagenomeSeq這兩大神器來進行分析,具體方法,我們會在下次小課堂帶來講解哦~敬請關注!
我們也衷心歡迎大家進入基因云(https://www.genescloud.cn/)嘗試使用,也可關注我們已經上線的網絡直播系列課程,每周四下午15:00不見不散,大家一起在線互動交流哦!