2016-09-08
通過之前小編對三代全長轉錄組測序的專題介紹(終于等到你......三代全長準路阻測序技術原理篇/三代測序將為轉錄組研究者帶來哪些驚喜),各位“諾米”們應該也了解到,利用三代基因測序平臺PacBio RSII/Sequel系統能獲得mRNA全長,更為精準地解讀mRNA的結構信息。可實現同源異構體分析,單堿基變異檢測,可變剪接分析,檢測融合基因,等位基因識別等。
可能“諾米”們會質疑,為何我們單頁里要專門強調分段建庫呢?那是因為基于PacBio平臺的測序原理,構建好的全長文庫要loading到測序小孔——零模波導孔(ZMWs),由于mRNA長度不同,在loading的過程中會產生loading bias,即測序小孔會優先被長度較短的片段占據,每個測序小孔只能容納一個文庫分子,而大部分長片段則會“無家可歸”。因此為盡量降低loading bias的影響,需要根據測序物種mRNA的長度進行分段,使一個文庫中的序列長度控制在一個較窄的范圍內。
通過小編的講解,“諾米”們是否茅塞頓開呢!而關于文庫方案的選擇,小編根據已有的一些文獻做了整理以供參考:
可見對于文庫的分段方式,并不是固定的。
文庫的數量和分段的形式可根據實際情況進行選擇和優化,主要考慮如下因素:
物種轉錄本的長度分布;
所關注的mRNA長度范圍;
mRNA的覆蓋度需求。
如需更好的實現mRNA的均勻覆蓋,在保證測序數據量的同時,最好盡可能多的構建文庫。而關于數據量的要求,將在下期跟各位“諾米”討論,敬請期待!
參考文獻:
1. Minoche A et al., Exploiting single-molecule transcript sequencing for eukaryotic gene prediction. Genome Biology (2015) 16:184
2. Abdel-Ghany S et al., A survey of the sorghum transcriptome using single-molecule long reads. Nature Communications (2016) 7:11706
3. Wang B et al., Unveiling the complexity of the maize transcriptome by single-molecule long-read sequencing. Nature Communications (2016) 7:11708