基因組框架圖和精細(xì)圖有什么不同?
框架圖能覆蓋基因組常染色體區(qū)域90%,覆蓋基因區(qū)域95%,Contig N5到5 kb,Scaffold N50達(dá)到20 kb,單堿基錯(cuò)誤率在十萬(wàn)分之一以下。精細(xì)圖能覆蓋基因組常染色體區(qū)域95%,覆蓋基因區(qū)域98%,Contig N5到20 kb,Scaffold N50達(dá)到300 kb,單堿基錯(cuò)誤率在十萬(wàn)分之一以下。
動(dòng)植物基因組從頭測(cè)序時(shí)為什么需要構(gòu)建不同類型的文庫(kù)?
因?yàn)閯?dòng)植物基因組大、復(fù)雜度高,且存在大量的重復(fù)區(qū)域,因此需要制備不同梯度的測(cè)序文庫(kù),進(jìn)行雙末端測(cè)序,使得在拼接中能夠跳過(guò)大范圍的重復(fù)區(qū),從而避免了基因組中重復(fù)序列造成 的錯(cuò)拼,提高了拼接的質(zhì)量;同時(shí)結(jié)合BAC或Fosmid文庫(kù)以及多種測(cè)序平臺(tái)的綜合運(yùn)用,保證了測(cè)序的準(zhǔn)確性和基因組的完整性,從而完成高等動(dòng)植物的基因組圖譜繪制。
在動(dòng)植物基因組從頭測(cè)序中,不同測(cè)序平臺(tái)分別有什么優(yōu)勢(shì)?
以Illumina 為代表的二代測(cè)序平臺(tái),具有測(cè)序數(shù)據(jù)量大,成本低,可以為基因組測(cè)序提供高覆蓋率的數(shù)據(jù)的優(yōu)勢(shì)。但是該平臺(tái)存在讀長(zhǎng)短、具有 GC 偏好性等特點(diǎn),難以跨過(guò)重復(fù)序列區(qū)域和高 GC 含量的區(qū)域。以PacBio 公司的RS II和Sequel 平臺(tái)為代表的三代測(cè)序平臺(tái),具有讀長(zhǎng)長(zhǎng)(平均reads 長(zhǎng)度 > 10 kb)、測(cè)序速度快(運(yùn)行時(shí)間短,單個(gè)SMRT Cell的運(yùn)行時(shí)間為2~6 hour)、通量高(平均每個(gè) SMRT Cell 產(chǎn)生~8G有效數(shù)據(jù))、無(wú) GC 偏好性、能檢測(cè)堿基修飾信息(包括甲基化修飾)、無(wú) PCR 偏向性(不需要經(jīng)過(guò) PCR 擴(kuò)增,避免測(cè)序覆蓋的不均一性)等特點(diǎn),尤其適合動(dòng)植物基因組的從頭測(cè)序。根據(jù)物種基因組的特點(diǎn)及復(fù)雜程度,派森諾生物會(huì)科學(xué)地設(shè)計(jì)測(cè)序?qū)嶒?yàn)方案,合理地將多個(gè)平臺(tái)搭配在一起使用,既能解決復(fù)雜基因組的測(cè)序難題,保證基因組測(cè)序的質(zhì)量,同時(shí)也能兼顧實(shí)驗(yàn)項(xiàng)目的經(jīng)濟(jì)性。