2016-09-13
軍團菌是一種致病菌,由于基因易位等因素具有約300個毒性蛋白。人們對其效應(yīng)蛋白(effector)的認(rèn)識較少。特拉維夫大學(xué)和芝加哥大學(xué)的研究者通過高通量測序得到了 38 株軍團菌基因組的框架圖,并對其編碼效應(yīng)蛋白的基因進行分析。研究者在 38 個菌株中總共預(yù)測得到 5,885 個編碼效應(yīng)蛋白的基因。進一步研究發(fā)現(xiàn),38 個菌株共有的“核心”效應(yīng)蛋白僅為 7 個,而其它大部分的效應(yīng)蛋白具有種間特異性。同時,檢測到很多保守的效應(yīng)蛋白結(jié)構(gòu)域和相互融合導(dǎo)致的未確定功能的效應(yīng)蛋白。相關(guān)的研究成果于近期發(fā)表在Nature Genetics雜志上。
測序、進化和基因組描述
研究者首先對來自軍團菌屬的 41 個菌株進行全基因組分析(其中, 38 株菌為本研究中測序的菌株,3 株菌為已經(jīng)測序的參考基因組菌株)。結(jié)果顯示,這 41 株菌的基因組大小在 2.37 Mb~4.82 Mb,GC含量在 36.7%~51.1%。進化分析顯示,這 41 株菌主要可以分為 3 個大的分支,見圖1。
圖1 軍團菌屬進化分析
Icm/Dot 分泌系統(tǒng)
Icm/Dot型分泌系統(tǒng)(IV B型分泌系統(tǒng))是軍團菌屬主要的致病系統(tǒng),由25個基因編碼,分布于兩個獨立的基因組區(qū)域。對這兩個區(qū)域的基因結(jié)構(gòu)進行分析,發(fā)現(xiàn)Icm/Dot區(qū)域基因的順序和方向高度保守。此外,在Icm/Dot 分泌系統(tǒng)中,發(fā)現(xiàn)了一些與該系統(tǒng)無關(guān)的片段,這些插入片段在不同菌株中的大小不等,見圖 2。
圖2 Icm/Dot 分泌系統(tǒng)區(qū)域II 在 41 個軍團屬中的分布
軍團菌屬效應(yīng)蛋白庫
根據(jù)文獻報道,軍團菌屬Icm/Dot 型分泌系統(tǒng)能轉(zhuǎn)移約 300 種效應(yīng)蛋白。采用機器學(xué)習(xí)方法對 41 個菌株進行效應(yīng)蛋白預(yù)測,總共預(yù)測得到 5,885 個效應(yīng)蛋白,可劃分為 608 個軍團屬效應(yīng)蛋白直系同源群(LEOGs)。其中,63% 的效應(yīng)蛋白(269 個 LEOGs,包含3,715 個效應(yīng)蛋白)為經(jīng)過實驗驗證的效應(yīng)蛋白(其功能直接采用實驗驗證或其直系同源蛋白采用實驗驗證);剩余的效應(yīng)蛋白(339 個LEOGs,包含 2,170 個效應(yīng)蛋白),代表新的效應(yīng)蛋白,具有潛在的新的功能。在所有預(yù)測的效應(yīng)蛋白中,只有 7 個效應(yīng)蛋白在所有分析菌株中共有,稱之為“核心效應(yīng)蛋白”,見圖 3。
圖3 軍團菌屬效應(yīng)蛋白的 Venn 圖
軍團菌屬 7 個核心效應(yīng)蛋白
盡管在軍團菌屬中發(fā)現(xiàn)了 608 個 LEOGs,令人驚訝的是,只有其中 7 個為核心效應(yīng)蛋白,這 7 個蛋白的進化歷史和其物種樹的進化歷史一致。其中 1 個核心效應(yīng)蛋白(LOG_00212,LegA3)能在目前所有已知的包含 Icm/Dot 分泌系統(tǒng)的細(xì)菌基因組中找到同源基因。另外 1 個核心效應(yīng)蛋白(LOG_00334,MavN)能在軍團菌目中的蟋蟀立克次小體菌(Rickettsiella grylli)基因組中找到同源基因,而不能在貝納特氏立克次體菌(Coxiella burnetii)基因組中找到同源基因。其余的 5 個核心效應(yīng)蛋白均不能在上述細(xì)菌基因組中找到同源基因,但是能在軍團菌目之外的細(xì)菌基因組中找到同源基因。
為了進一步對這 7 個核心效應(yīng)蛋白的功能進行分析,研究者在L. pneumophila 菌株中分別構(gòu)建了這 7 個基因的敲除菌株(單個基因敲除),并研究這些敲除菌株在A. castellanii的細(xì)胞內(nèi)生長情況。結(jié)果顯示, LegA3 和 MavN 蛋白部分與該菌在該宿主的細(xì)胞內(nèi)生長所必須。盡管這 7 個效應(yīng)蛋白的準(zhǔn)確功能未知,考慮到這 7 個效應(yīng)蛋白在軍團菌屬進化過程中高度保守,推測它們可能在侵染過程中起關(guān)鍵作用。基因敲除實驗發(fā)現(xiàn),僅有 2 個核心效應(yīng)蛋白與該菌在宿主細(xì)胞內(nèi)的生長相關(guān),這可能暗示,其余 5 個核心效應(yīng)蛋白至少在L. pneumophila菌在A. castellanii細(xì)胞內(nèi)的生長是冗余的。當(dāng)然,這些核心效應(yīng)蛋白可能在該菌在其他宿主細(xì)胞內(nèi)生長所必須。
軍團菌屬中的菌株特異效應(yīng)蛋白
在 608 個 LEOGs 中,258 個 LEOGs 為菌株特異的,即僅在一個軍團菌種中存在。其中,188 個 LEOGs與軍團菌基因組中的其它蛋白顯示局部的序列相似性(E-value < 1×10-4),70 個LEOGs 與軍團菌基因組中的其它蛋白無序列相似性。
效應(yīng)蛋白基因的獲得和丟失
結(jié)合進化樹分析效應(yīng)蛋白基因的獲得與丟失,結(jié)果顯示軍團菌屬中的效應(yīng)蛋白庫處于動態(tài)變化中,不同分支的效應(yīng)蛋白獲得與丟失的速率不同。進化關(guān)系上比較接近的種更傾向于具有相似的效應(yīng)蛋白數(shù)據(jù)集,見圖4。對這些經(jīng)歷大量的基因水平轉(zhuǎn)移效應(yīng)蛋白的進化分析結(jié)果表明,效應(yīng)蛋白基因的基因水平轉(zhuǎn)移事件更傾向于發(fā)生在進化關(guān)系接近的種間。
圖4 假定效應(yīng)蛋白池在軍團菌屬的比較
效應(yīng)蛋白的共線性和協(xié)同進化
在一些案例中,在基因組中處在相近位置的效應(yīng)蛋白編碼基因在宿主細(xì)胞中往往協(xié)同起作用。研究者分析了多個基因組中連接在一起的效應(yīng)蛋白編碼基因(效應(yīng)蛋白之間相鄰不超過 5 個ORFs),總共找到 143 對效應(yīng)蛋白編碼基因至少在 2 個基因組中鄰近,其中,51對效應(yīng)蛋白編碼基因組在至少5個基因組中鄰近。進一步分析這些ORFs的共進化情況,發(fā)現(xiàn)這些效應(yīng)蛋白的編碼基因共同獲取或者丟失的情況遠遠高于偶然幾率,最終確定19對效應(yīng)蛋白編碼基因是共進化的,并且協(xié)同發(fā)揮作用。
效應(yīng)蛋白進化的主因:結(jié)構(gòu)域重組
之前的研究報道,L. pneumophila的效應(yīng)蛋白包含大量來自真核生物的結(jié)構(gòu)域和效應(yīng)蛋白特異的結(jié)構(gòu)域。采用兩種方法對效應(yīng)蛋白的保守結(jié)構(gòu)域進行分析:與結(jié)構(gòu)域數(shù)據(jù)庫中的已知結(jié)構(gòu)域進行比對分析;對效應(yīng)蛋白直系同源物的保守區(qū)域分析。結(jié)果顯示,在56%的假定蛋白中檢測到了保守的結(jié)構(gòu)域。99個結(jié)構(gòu)域可通過上述兩種方法同時檢測到,其中 53 個結(jié)構(gòu)域功能已知(大部分來自于真核生物),46 個結(jié)構(gòu)域保守蛋白,功能未知。研究者發(fā)現(xiàn)不同的蛋白質(zhì)結(jié)構(gòu)經(jīng)常分享相同的結(jié)構(gòu)域。將蛋白質(zhì)的結(jié)構(gòu)通過共有的結(jié)構(gòu)域進行連接形成網(wǎng)狀結(jié)構(gòu)進行可視化,節(jié)點為共有的結(jié)構(gòu)域,發(fā)現(xiàn)錨蛋白重復(fù)結(jié)構(gòu)域、磷脂酰肌醇-4-磷酸結(jié)合域(PI4P)和富含亮氨酸的重復(fù)單元(LRR)結(jié)構(gòu)域為最大的蛋白結(jié)構(gòu)連接區(qū)域,見圖 5。通過PI4P結(jié)構(gòu)域和LED006對編碼效應(yīng)蛋白的基因進行預(yù)測分析得到效應(yīng)蛋白編碼基因,具體結(jié)果見圖6。上述結(jié)果驗證了軍團菌效應(yīng)蛋白功能多樣性的原因以及結(jié)構(gòu)域重組對于軍團菌共進化的重要作用
圖 5 效應(yīng)蛋白的結(jié)構(gòu)網(wǎng)絡(luò)
圖 6 包含PI4P或LED006結(jié)構(gòu)域的蛋白結(jié)構(gòu)
結(jié)論:
在軍團菌可以導(dǎo)致嚴(yán)重的疾病大背景下,通過高通量測序完成了38株軍團菌的框架圖,并針對其致病性進行深入分析。研究了與致病性相關(guān)的分泌系統(tǒng)和效應(yīng)蛋白,發(fā)現(xiàn)編碼分泌系統(tǒng)的基因較為保守,而編碼效應(yīng)蛋白的基因差異較大,只有7個效應(yīng)蛋白編碼基因為軍團菌屬核心共有基因。進一步分析效應(yīng)蛋白多樣性的原因發(fā)現(xiàn)結(jié)構(gòu)域重組是其多樣性的原因,而結(jié)構(gòu)域在不同的軍團菌中可以共有。
文章亮點:
選材好:選取的材料為人致病菌,受關(guān)注程度高;
立足點好:選取了 38 個軍團菌屬的菌株進行測序,故事內(nèi)容主要是講其致病基因,即效應(yīng)蛋白和分泌系統(tǒng);
會講故事:研究者有淺入深,層層遞進,完整地闡述了一個故事。