2022-10-17
《Metabolites》 影響因子:5.581
近日,云南大學生態(tài)與環(huán)境學院在生物學領域的《Metabolites》發(fā)表新研究成果!研究對C. pseudotenuipes進行了全基因組測序,并與三個同屬物種的基因組進行了比較分析,確定其基因組的特征。此外,還探索了蟲草屬基因組中的次生代謝物(SMs)和生物合成基因簇(BGCs)。本研究為靶向基因組挖掘提供了可能,如基因敲除、微生物基因的導入或異源表達、啟動子調(diào)控、突變誘導等,以喚醒沉默的BGC并合成更多新的生物活性SMs,進而用于新藥研發(fā)。
研究背景 C. pseudotenuipes是2022年4月發(fā)布的一種新真菌,該物種是根據(jù)其形態(tài)與C. tenuipes的相似性命名的。從分類學上講,該種與C. tenuipes及其類似類群(C. cicadae和C. militaris)有親緣關系。蟲草屬具有多種生物活性成分,包括蟲草素、蟲草多糖、生物堿、蟲草酸、噴司他丁、ophicordin、白僵菌素等,這些生物活性成分以不同方式發(fā)揮作用。 基因組挖掘是一種從基因組數(shù)據(jù)中自動檢測和注釋生物合成基因簇(BGC)的方法。隨著基因組測序的發(fā)展,如新化合物的鑒定和表征,增加了基因組挖掘的應用范圍。前人通過基因組挖掘發(fā)現(xiàn),C. militaris的cns1-cns3基因簇產(chǎn)生蟲草素和戊烯酮,其中cns1和cns2是合成蟲草素所必需的,而cns3是戊烯酮合成所必需的。而且,C. militaris基因組內(nèi)非核糖體肽類合成合酶(NRPS;T-C-A-T-C-C-A-T-C-A-T-C-C),多聚乙酰合酶(PKS;KS-AT-DH-MT-ER-KR-ACP),酰基轉移酶,和ATP依賴長鏈脂肪酸酰基輔酶等催化白僵菌內(nèi)脂合成,該化合物是通過在構巢曲霉中異源表達產(chǎn)生的。為了進一步探索C. pseudotenuipes產(chǎn)SM的能力,對其進行了全基因組測序和分析,并將其與蟲草屬其中的菌株進行了基因組比較和產(chǎn)SM能力比較分析。
研究材料與方法 1、實驗材料 蟲草屬菌株分別取自越南沙巴、云南省貢山縣、云南省楚雄市、云南省昆明 2、測序平臺 Illumina NovaSeq 3、分析內(nèi)容 真菌基因組測序+組裝+注釋、次生代謝產(chǎn)物合成基因簇分析、共線性分析、進化樹構建。
研究結果 1. C. pseudotenuipes基因組特征 C. pseudotenuipes基因組全長30.1 Mb,包含527個scaffold,N50為131,856 bp,GC含量為54.11%。基因預測得到8705個蛋白質編碼基因,基因序列總長度為13.97 Mb,平均序列長度為1605.2 bp(表1)。此外,還預測出了124 個tRNA、31個rRNA和37 個snRNA等非編碼RNA。 表1 C. pseudotenuipes基因組組裝與功能注釋結果 EggNOG數(shù)據(jù)庫注釋結果表明,大多數(shù)預測基因在功能上與“功能未知”(3079)、“翻譯后修飾、蛋白質轉換”和“碳水化合物運輸和代謝”相關(圖1a)。KEGG功能聚類揭示了用于遺傳信息處理(2295)、信號和細胞處理(619)以及信號轉導(562)的蛋白質家族(圖1b)。GO注釋表明,生物過程(5316)、細胞氮化合物代謝過程(1566)和生物合成過程(1425)為富集的生物過程術語。此外,注釋還揭示了分子功能(4861)、離子結合(2016)和氧化還原活性(767)等分子功能術語富集,以及細胞(2453)、細胞內(nèi)(2352)和細胞組分(1972)等細胞組分術語富集(圖1c)。 圖1:C. pseudotenuipes基因組功能注釋 病原體與宿主相互作用數(shù)據(jù)庫(PHI庫)注釋結果表明,C. pseudotenuipes包含毒力降低(1108)、致病力未受影響(970)、致病性喪失(208)、致死(123)、高毒力(89)、植物無毒決定因子(16)、化學敏感性(7)、抗藥性(5)和增強對抗性(2)的基因(圖2)。結果表明,主要的注釋基因是降低毒力和不影響致病性的,表明C. pseudotenuipes是一種輕度致病菌株。 圖2:C. pseudotenuipes病原PHI表型突變類型的分布 此外,碳水化合物活性酶注釋結果還顯示C. pseudotenuipes含有396個相關基因,包括168個糖苷水解酶(GHs)和63個碳水化合物酯酶(CE)、56個輔助活性(AAs)、16個碳水化合物結合模塊(CBM)和3個多糖裂解酶(PLs)(圖3),此注釋結果表明該菌株可能會捕獲更多的能量并分解復雜的碳水化合物。 圖3:C. pseudotenuipes CAZy酶功能分類 2. 比較基因組分析 將C. pseudotenuipes與三個近緣物種進行了比較基因組分析。結果表明,4個物種中基因組大小由大到小分別為:C. cicadae(34.11 Mb)、C. militaris(32.27 Mb)、C. pseudotenuipes(30.1 Mb)和C. tenuipes(30.06 Mb);scaffolds數(shù)依次為:C. cicadae(595個),C. pseudotenuipes(527個)、C. tenuipes(285個)和C. militaris(32個)。C. pseudotenuipes、C. tenuipes、C. cicadae和C. militaris的GC含量分別為54.11%、53.72%、52.70%和51.40%。 表2:蟲草屬基因組組裝結果比較 3. 次生代謝產(chǎn)物合成基因簇分析 由次級代謝產(chǎn)物基因簇結果發(fā)現(xiàn),C. pseudotenuipes和C. cicadae具有相同的SM BGC(31),其次是C. militaris(29)和C. tenuipes(28)。預測的BGC與MIBiG數(shù)據(jù)庫中的已知簇顯示出不同程度的遺傳同源性,其中C. pseudotenuipes的同源性最高(37.93%),其次是C. tenuipes(28.57%)和C. cicadae(25.81%)。C. pseudotenuipes、C. tenuipes、C. cicadae和C. militaris基因組預測的BGC可能合成dimethylcoprogen。相比之下,通過C. pseudotenuipes、C. tenuipes和C. cicadae中預測的BGC預測了催化leucinostatin A/B、neosartorin、dimethylcoprogen wortmanamide A/B和白僵菌素等生物合成的基因。這些結果表明,同屬的相似物種具有不同類型和數(shù)量的BGC及催化合成化合物。 C. pseudotenuipes、C. tenuipes和C. cicadae的幾條BGC序列與MIBiG序列100%相似。預測的C. militaris區(qū)域358.1、C. pseudotenuipes區(qū)域71.1、C. cicadae區(qū)域56.2和C. tenuipes區(qū)域18.2可能與dimethylcodogen生物合成有關(圖4a)。C. pseudotenuipes區(qū)域111.1和區(qū)域34.1負責epichloenin A的生物合成(圖4b),C. pseudotenuipes區(qū)域2.2負責clavaric acid的生物合成。Local-BLAST比對結果表明,dimethylcodogen合成需要具有A-P-C-P-C結構域、乙酰轉移酶、PRK08315超家族和MFS超家族的酶。此外,epichloenin A的合成需要NRPS(A-A-A-P-C)、PTZ00265超家族和MFS超家族。 圖4:C. pseudotenuipes、C. tenuipes、C. militaris和C. cicadae的BGC與已鑒定的dimethylcoprogen(a)和epichloenin A(b)的生物合成BGC的成分比較 C. pseudotenuipes、C. tenuipes、C. cicadae和C. militaris中假定SM BGC的五個主要生物合成基因與MIBiG數(shù)據(jù)庫中已知的基因簇相似(40%至85%)。C. pseudotenuipes 區(qū)域78.1、C. cicadae區(qū)域94.1和C. militaris區(qū)域426.1是鯊烯合成抑制劑S1的合成區(qū)。C. tenuipes區(qū)域38.2、C. cicadae區(qū)域117.1和C. militaris區(qū)域95.1可能合成viriditoxin,而C. cicadae區(qū)域1.2、C. militaris區(qū)域346.1和區(qū)域468.1分別合成鐵色素、phomasetin和fumosorinone。結果表明, C. pseudotenuipes缺乏合成viriditoxin的潛力,催化合成viriditoxin除了需要核心酶PKS(SAT-KS-AT-PT-ACP-ACP-ACP-TE)外,還需要其他幾種酶(圖5a)。此外,C. militaris 區(qū)域346.1的核心基因結構域(KS-AT-MT-KR-ACP-C-A-P-TE)和修飾基因與LC361337.1相似。由于修飾基因的位置和方向不同,其余三個物種缺乏合成phomasetin的潛力。這些結果表明,C. militaris 區(qū)域468.1與合成fumosorinone的基因簇相似(圖5c)。結果表明功能酶的位置和方向在物種之間不同。 圖5:比較viriditoxin(a)、phomasetin(b)和fumosorinone(c)假定生物合成基因簇 C. tenuipes、C. cicadae和C. pseudotenuipes的整個基因組包含的基因簇與那些負責白僵菌素(BEA)BGC合成的基因簇高度相似(圖6)。蟲草屬和球孢白僵菌之間的BEA BGC高度相似性表明,這些屬之間存在一定程度的水平基因轉移,盡管基因序列在方向和位置上有所不同,但在不同物種之間可能發(fā)生基因丟失/獲得。 圖6:比較白僵菌素生物合成基因簇和結構 此外,C. tenuipes區(qū)域36.1、C. cicadae區(qū)域27.1和C. pseudotenuipes區(qū)域112.1的基因簇類似于wortmanamide A/B BGC(圖7)。C. tenuipes區(qū)域36.1、C. cicadae區(qū)域27.1和C. pseudotenuipes區(qū)域112.1的雜交PKS-NRPS結構域為KS-AT-DH-MT-KR-ACP-C-A-(P)-SDR。KS-AT-DH-MT-KR-ACP-C是催化合成wortmanamide A/B的結構域。這些結構域也有略微不同的修飾基因。因此,C. tenuipes區(qū)域36.1、C. cicadae區(qū)域27.1、C. pseudotenuipes區(qū)域112.1可能會合成wortmanamide或其類似物。 圖7:比較wortmanamide A或wortmanamide B生物合成基因簇和結構 4. 聚類分析 蟲草屬PKS和PKS-NRPS與其他真菌PKS和PKS-NRPS的聚類結果表明,C. militaris區(qū)域346.1與Pyrenochaetopsis物種聚集,可能催化phomasetin或其類似物的生物合成。C. militaris區(qū)域95.1、C. cicadae區(qū)域117.1和C. tenuipes區(qū)域38.2與PKS蛋白聚集在一起,可能催化Paecilomyces variotii中的viriditoxin或其類似物合成。C. pseudotenuipes區(qū)域112.1,C. cicadae區(qū)域27.1、C. tenuipes區(qū)域36.1和鄔氏黃絲曲霉分別聚集在一個獨立分支上,可能催化wortmanamide A/B或其類似物的合成。C. militaris區(qū)域468.1與C. fumosorosea聚集在一起,可能催化fumosorinone或其類似物的生物合成。C. pseudotenuipes區(qū)域71.1、C. cicadae區(qū)域56.2和C. tenuipes區(qū)域18.2與交鏈格孢菌聚集在一起,可能產(chǎn)生dimethylcoprogen或其類似物。C.pseudotenuipes區(qū)域44.1、C. cicadae區(qū)域87.1和C. tenuipes區(qū)域63.1聚集在白僵菌的一個單獨分支上,可能催化BEA或其類似物的生物合成。同樣,C. pseudotenuipes區(qū)域111.1和C. tenuipes區(qū)域34.1與Epichloe festucae聚集在一個獨立的分支上,是一段Epichlo festuceae中催化Epichlonein A生物合成的蛋白質序列。故假設這兩個區(qū)域可能催化Epichlonein A或其類似物的合成。 5. 共線性分析 對含有SM BGC的C. cicadae(24)、C. militaris(26)、C. pseudotenuipes (27)和C. tenuipes(28)的基因組scaffold進行了共線性分析。SM BGC所在的scaffold分為70多個共線區(qū)塊,存在重排現(xiàn)象(圖8)。 圖8:含有次生代謝物合成基因簇scaffold的共線性分析
結論 本研究對C. pseudotenuipes基因組進行了測序分析,發(fā)現(xiàn)其基因組在調(diào)節(jié)蛋白活性和轉化、信號轉導和代謝、碳水化合物運輸和代謝、捕獲能量和分解碳水化合物等方面具有豐富的功能基因。此外,蟲草屬物種只有七個假定的BGCs與已知的基因簇高度相似,表明該物種具有產(chǎn)生其他次生代謝物的巨大潛力,這些發(fā)現(xiàn)為靶向基因組挖掘提供了可能。
本研究的denovo測序和部分分析由上海派森諾生物科技股份有限公司完成。如需進一步討論,歡迎發(fā)郵件或者致電我們喲(郵箱地址:[email protected],聯(lián)系電話:025-56165883-832)!
文章索引:Lu Y, Wang Y, Yuan X, et al. Genomic Comparative Analysis of Cordyceps pseudotenuipes with Other Species from Cordyceps. Metabolites 2022, 12, 844.