2023-12-14
《Journal of Fungi》
近日,吉林大學在微生物領域的《Journal of Fungi》發表新研究成果!本研究將葡萄中分離得到的非釀酒酵母菌S.bacillus CC-PT4 (CGMCC No. 23573)進行基因組測序和生物信息學分析,分析其有益特性、次生代謝產物、生物合成基因簇、殺傷毒素、溶葡萄球菌素、脅迫適應性、絮凝性和粘附安全性,為后續該菌株的研究奠定基礎。
01、研究背景
非釀酒酵母常見于葡萄、釀酒及相關環境中。該物種于2002年首次在美國納帕谷受葡萄霉變影響的葡萄酒中分離,隨后在匈牙利的白葡萄酒中分離,鑒定其為新種并命名為Candida zemplinina。經同工酶譜、26S rDNA酶切譜、26S rDNA測序分析,最終歸類為S. bacillaris 。S.bacillus具有良好的高滲透耐受性,可以耐受高濃度的糖和乙醇,該菌株在發酵過程中產生甘油和低濃度乙醇以及多種風味。此外,S.bacillus具有嗜果糖特性,Saccharomyces cerevisiae具有嗜糖特性,這使得它們能夠在發酵過程中長時間共存。許多研究發現,酵母與釀酒酵母混合發酵有利于提高葡萄酒的香氣。
化學殺菌劑是抑制病原體的傳統方法,但反復使用這些化合物通常會導致各種不良反應。然而,生物防治劑是減少化學殺菌劑使用的一種潛在替代品。釀酒酵母、布拉爾氏酵母和馬氏克魯維酵母都已被證明具有生物防治作用,桿菌也被證明具有生物防治的潛力。其抑菌機制可能包括營養物競爭、空間競爭、產生降解酶、殺傷毒素和揮發性有機物等。本文對S.bacillus CC-PT4進行了全基因組測序并進行了生物信息學分析,發現S.bacillus CC-PT4對MRSA(抗藥性金黃色葡萄球菌)具有抑制作用,對惡劣環境具有良好的適應性。此外,S.bacillus CC-PT4攜帶與致病性和耐藥性相關的基因。總的來說,本研究對S.bacillus CC-PT4的全基因組測序和分析為了解該菌株的生物學特性和進一步開發提供了有價值的信息。
02、研究材料與方法
1.實驗材料:S.bacillus CC-PT4
2.測序平臺:Illumina NovaSeq + PacBio
3.分析內容:真菌近完成圖,次生代謝產物合成基因簇預測,絮凝與粘附分析等。
03、研究結果
1. S.bacillus CC-PT4基因組測序及組裝
S.bacillus CC-PT4全基因組大小為9.45 Mb, GC含量為39.50%。包含5個scaffolds,最長scaffold為4,159,713 bp,最短scaffold為8,503 bp, N50為4,154,241 bp。S.bacillus CC-PT4基因組圈圖如圖1所示。通過在基因組序列中完全對齊的單拷貝基因數量占單拷貝基因總數的百分比來評估基因組組裝的完整性,其中63.3%的基因與BUSCO單拷貝基因完全對齊。
圖1 S.bacillus CC-PT4基因組圈圖
2.功能原件分析
經預測,S.bacillus CC-PT4有286個串聯重復序列和1,020個分散在基因組中的穿插重復序列,S.bacillus CC-PT4有123個tRNAs, 4個rRNAs和7個其他非編碼RNAs。菌株CC-PT4基因組共預測到4,150個基因,占總基因組長度的63.70%,平均每個基因長度為1450.8 bp,共有4,266個外顯子,平均每個基因有1個外顯子,占總基因組長度的63.44%。
3. 基因注釋
在蛋白編碼基因中,P450數據庫共注釋了4,056個(97.73%)基因,其次是NCBI nr數據庫(3,538個,5.25%)、eggNOG數據庫(3,185個,76.45%)、KEGG數據庫(2,610個,62.89%)、Swiss-Prot數據庫(3,363個,81.04%)、Go數據庫(2,888個,69.59%),TCDB數據庫(670個,16.14%)。
本研究統計了S.bacillus CC-PT4在NCBI nr中注釋到的3,538個基因的物種信息,排名前25位的物種共涉及3,074個基因(圖2),但標注的基因中有10個序列一致性不低于97%的基因屬于Starmerella屬,9個基因為S.bacillus,其中4個基因序列一致性為100%(表1)。
進一步,用eggNOG對S.bacillus CC-PT4蛋白進行功能注釋并進行聚類分析。用eggNOG對S.bacillus CC-PT4標記的3,185個基因的分類結果如圖所示。有499個基因沒有明確的功能,這可能與缺乏對桿菌的研究和缺乏內參基因有關。功能分類明確的注釋基因最多的是翻譯、核糖體結構和生物發生(321個);與碳水化合物轉運代謝、脂質轉運代謝、氨基酸轉運代謝相關的基因分別有146、108、145個。而細胞外結構和核結構所標注的信息較少(4個基因)。有57個基因與次生代謝產物的生物合成、轉運和分解代謝相關。此外,未發現與細胞運動相關的基因,這與酵母是一種非運動微生物的事實是一致的。
KEGG共標記2,610個基因,分為8個大類和50個亞類。其中,與遺傳信息處理功能相關的基因數量最多,其次是信號轉導和細胞過程。Swiss-Prot數據庫中S.bacillus CC-PT4基因組注釋到3,363個基因。在GO數據庫中,S.bacillus CC-PT4基因組有4,109個分子功能注釋基因,8,560個細胞成分注釋基因,10,108個生物過程注釋基因。
圖2 各數據庫注釋統計結果
表1 NCBI nr注釋的S.bacillus CC-PT4基因組序列統計(前10)
4. CAZy分析
CAZy數據庫主要包含與糖苷鍵的降解、修飾和生成相關的酶家族。酶家族被分為六類:糖苷水解酶(GHs)、多糖裂解酶(PLs)、碳水化合物酯酶(CEs)、糖基轉移酶(GTs)、輔助活性(AAs)和碳水化合物結合模塊(CBM)。經預測,S.bacillus CC-PT4含有95個CAZy酶基因(表2)。
表2 CAZy分析統計
5.次生代謝產物合成基因簇
在antiSMASH預測的S.bacillus CC-PT4基因組中發現了兩個次生代謝產物生物合成基因簇,分別是非核糖體肽合成酶簇和萜烯類。對上述基因進行MIBIG數據庫注釋,各基因BLAST得分最高的注釋結果見表3。
圖3 S.bacillus CC-PT4次生代謝產物生物合成基因簇的預測結果
表3 基于MIBIG的S.bacillus CC-PT4次級代謝合成基因簇的注釋結果
6. Killer toxin 和 Lysostaphin基因
Killer toxin是酵母分泌的一種有毒蛋白質,可以殺死其他酵母,但對自己不會造成傷害。Lysostaphin可特異性水解金黃色葡萄球菌肽聚糖的五甘氨酸交聯,從而裂解金黃色葡萄球菌,對耐藥金黃色葡萄球菌具有同樣的抑菌作用。根據S.bacillus CC-PT4基因組的注釋結果顯示有2個基因編碼Killer toxin,1個基因編碼Lysostaphin (表4)。
表4 S.bacillus CC-PT4基因組中的Killer toxin 和 Lysostaphin基因
7. 適應力和耐藥分析
根據酵母基因組在eggNOG、Swiss-Prot和NCBI nr數據庫中的注釋,尋找參與脅迫適應的相關基因。結果表明,S.bacillus CC-PT4基因組中存在許多有利于菌株適應惡劣脅迫的基因,包括抗pH脅迫、抗膽汁脅迫、抗氧化應激、抗離子和重金屬脅迫、抗熱應激和其他脅迫。根據S.bacillus CC-PT4基因組的注釋結果,該菌株中有30個耐藥相關基因。
8. ,絮凝與粘附性分析
從SGD下載FLO1、FLO5、FLO8、FLO9、FLO10、FLO11、FIG2和AGA1編碼絮凝蛋白序列,并對S.bacillus CC-PT4基因組進行BLAST處理。結果表明,S.bacillus CC-PT4基因組中有5個基因(scaffold1.378, scaffold1.1051, scaffold1.1055, scaffold2.1852, scaffold2.1859)編碼絮凝蛋白。從圖4可以看出,基因scaffold1.378與FLO1、FLO5、FLO10三個絮凝蛋白具有序列一致性,基因scaffold2.1852與FLO1、FLO5、與FLO9中的具有序列一致性,基因scaffold2.1859與FLO9、FLO10具有序列一致性。此外,這些基因與絮凝蛋白的多個序列片段具有同源性。
此外,從SGD中下載了41個與粘附相關的蛋白序列,并利用BLAST對S.bacillus CC-PT4基因組和這些蛋白進行了分析。結果顯示,S.bacillus CC-PT4基因組中65個基因與粘附蛋白BGL2、CKA2、CRH1、CRR1、CWH41、DCW1、DFG5、FKS3、GSC2、KRE6、KTR1、LAS21、PST1、ROT2、SCW10、SCW11、SCW4、SKN1、SMK1、SPI1、SUN4、UTR2、YPS1、YPS3的一個或多個蛋白序列一致。
圖4 利用絮凝蛋白序列對S.bacillus CC-PT4基因組進行BLAST分析
9. 致病性分析
根據S.bacillus CC-PT4全基因組預測的PHI表型突變型基因數量統計如圖5所示。PHI數據庫共注釋到1013個基因,其中最多的是毒力降低,有545個基因,而拮抗增強的基因為零。通過進一步分析,發現與人類疾病相關的基因有34個(表5)。
圖5 S.bacillus CC-PT4中病原菌-宿主相互作用(PHI)基因的分布
表5 S.bacillus CC-PT4毒力分析
04、結 論
本研究對S.bacillus CC-PT4的全基因組序列進行了組裝和生物信息學分析。S.bacillus CC-PT4全基因組大小為9.45 Mb, GC含量為39.50%。此外,利用多個生物信息學數據庫預測和注釋了4150個蛋白質編碼基因。蛋白質編碼基因的注釋結果顯示,許多基因與應激適應、次生代謝產物、抗菌功能、安全性等相關,包括2個次生代謝產物合成基因簇,2個基因編碼Killer toxin,1個基因編碼Lysostaphin。綜上所述,獲得S.bacillus CC-PT4的全基因組序列有助于更好地了解該菌株的特性,有利于該菌株的挖掘和應用。
本研究的真菌基因組測序與分析由上海派森諾生物科技股份有限公司完成。如需進一步討論,歡迎發郵件或者致電我們喲(郵箱地址:[email protected],聯系電話:025-56165883-832)!
文章索引:
Yong Shen, Xue Bai, Xiran Zhou, et al. Whole-Genome Analysis of Starmerella bacillaris CC-PT4
against MRSA, a Non-Saccharomyces Yeast Isolated from Grape [J]. Journal of Fungi, 2022, 8:1255.
doi:10.3390/jof8121255