2020-09-17
16S rDNA是編碼原核生物核糖體小亞基的基因,長度約為1542bp,其分子大小適中,突變率小,是細菌系統分類學研究中最常用和最有用的標志。16S rRNA基因序列包括9個可變區(Variable region)和10個保守區(Constant region),保守區序列反映了物種間的親緣關系, 而可變區則能體現物種間的差異。通過檢測16S rDNA可變區的序列變異和豐度,可了解環境樣品中群落多樣性信息,在微生物分類鑒定、微生態研究等方面起著重要的作用。
圖1:16S rDNA結構圖
我們知道,細菌16S全長一共有V1-V9九個區,受illumina測序技術限制,不管選擇一個還是兩個V區,我們在進行物種注釋時都僅能注釋到屬水平,而無法將其準確注釋到物種水平。Sanger測序雖能接近全長,但通量低,且成本高,不適用群體復雜的宏樣本。
受Sanger和NGS各自的測序劣勢限制,同時兼具長讀長和高通量優勢的三代單分子測序技術應運而生,下面小編總結了三代Pacbio測序平臺在16S全長研究應用中的幾點優勢:
1、高準確率:16S全長在Pacbio測序中選用CCS(circular consensus sequencing)模式,產生的reads通過CCS算法需要至少三輪讀取,準確率在0.99以上。
2、更準確的物種分類,更多的物種鑒定。
3、能精確定位到“種”水平。
全長16S測序流程
全長16S生信分析流程
案例解析
標題:利用三代測序技術對微生物組實現“高分辨率”解析
該研究于2016年發表于微生態領域頂級期刊《The ISME Journal》上(最新影響因子:9.328)。
原文鏈接:
https://www.nature.com/articles/ismej2015249
研究背景
過去十多年中,隨著短讀長、高通量二代測序的興起,以16S rRNA基因部分可變區序列為目標的分析方法,逐漸替代了基于rRNA基因全長克隆文庫的一代Sanger測序法,使我們能對菌群組成進行深度定量解析。然而,由于二代測序讀長短的特性,我們無法對測得物種進行精確的分類鑒定,從而限制了我們對菌群代謝功能的深入理解。隨著三代SMRT測序技術的出現,我們有望從根本上解決這一瓶頸,實現對rRNA基因全長序列的高通量精準測序。
研究方法
樣本來源:23種細菌和3種古菌組成的人工菌群,以及取自湖水的天然微生物群落樣本
測序平臺:PacBio RS II(16S rRNA基因全長)+Illumina MiSeq(16S rRNA基因V4區)
對兩種測序平臺的測序結果進行多樣性組成譜分析,并通過計算機模擬,比較16S rRNA基因全長序列和單V區序列的物種分辨能力。
研究結果
根據兩種平臺的測序結果,門水平的菌群組成較為相似,但在更精細的水平存在差異。同時,三代測序的結果顯著降低了物種分類信息的不確定性。計算機模擬的結果也表明,短讀長的單V區測序可能嚴重低估某些特定類群的微生物,比如水體樣本中參與氮循環和甲烷代謝的物種。因此,基于三代測序的菌群多樣性組成譜分析能極大地提升物種分類鑒定的精確性,實現“高分辨率”檢測的同時,也為深入闡釋菌群的代謝功能奠定了基礎。
兩種測序平臺測序結果的整體比較。兩者菌群的整體結構較為相似,但當菌群復雜程度增加時(底圖子圖),兩者的檢測結果有所差異。PhyloTags,三代PacBio RS II測序結果;iTags,Illumina MiSeq測序結果。
16S rRNA基因各V區的序列保守性并不一致,因而基于16S rRNA基因全長序列的三代測序,可以更全面地反映物種的種屬信息。a圖,以Salmonella屬為代表,全長序列的種間差異達到97.4%,但V4區高度保守,二代測序結果將低估該物種的多樣性;b圖,某些物種在V4區的多樣性可能高于其他V區,因而二代測序結果將高估相關物種的多樣性。
兩種測序平臺測序結果的精細比較。a圖,三代測序的結果顯著降低了物種分類信息的不確定性;b圖,二代單V區測序結果可能會嚴重低估某些特定微生物類群的含量(以方框標記)。
研究結論
綜上所述,運用三代測序技術進行微生物組研究,將顯著提升菌群多樣性組成譜解析的精準性和全面性。
參考文獻
Singer, E., Bushnell, B., Coleman-Derr, D., Bowman, B., Bowers, R.M., Levy, A., Gies, E.A., Cheng, J.-F., Copeland, A., Klenk, H.-P., et al. (2016). High-resolution phylogenetic microbial community profiling. ISME J 10, 2020-2032.