2022-06-06
《BMC PLANT BIOLOGY》
影響因子:4.215
近日,派森諾生物與四川大學合作,在植物生物學領域的《BMC PLANT BIOLOGY》發表新研究成果!在本研究中,對分離得到的7個前胡屬的葉綠體基因組進行denovo測序和比較基因組學分析,結果發現該屬的葉綠體基因組既具有保持性,又具有多樣性,該研究為前胡屬物種的肢體基因組進化、分類學和系統發育提供了新的視角。
研究背景
前胡屬(Peucedanum)是傘形科(Apiaceae)的較大的屬之一,其擁有許多經濟和醫學上的重要植物。前胡屬是一種異質性極強的物種,在生命形式、葉片和果實結構、化學成分等方面表現出極大的多樣性。因此,一些研究人員傾向于把這個屬分成更小的、可能的分類單元。然而,由于葉片分裂、小苞片和分果的形態特征不同,很難從前胡屬中再分離出一個屬。因此,基于形態學特征去分類該屬面臨著挑戰。
葉綠體基因組是植物三個DNA基因組(包括細胞核基因組和線粒體基因組)之一,該基因組在開花植物中是單親本遺傳的,缺乏重組,具有告訴可變的形狀,因此,它有可能顯著提高系統發育的支持度和分辨率。此外,葉綠體基因組的基因學分析和比較基因組學分析可以揭示葉綠體在結構組織、基因排列和內容上的多樣性,從而加上對植物譜系適應進化的認識,并確定適合物種鑒定的突變熱點。近年來,隨著高通量測序和生物信息學技術的發展,葉綠體基被廣泛成功地用于植物系統發育分析和特異性DNA條形碼的開發。
在本研究中,對7個前胡屬的葉綠體進行了測序,結合之前報道的5個葉綠體,對這一分類困難的植物類群的葉綠體進行了全面的分析。本研究的目的是:(1)研究前胡屬植物的葉綠體體特征;(2)從葉綠體中篩選出合適的突變熱點區域作為候選DNA條形碼,用于前胡屬植物的物種鑒定;(3)檢測葉綠體對復雜前胡屬植物系統發育支持度和分辨率的影響。本研究結果將為白皮屬植物的系統發育和分類學研究奠定基礎。
研究材料與方法
1.實驗材料:
溫室和野外中采集到的7個前胡屬葉片,提取葉片total DNA后進行葉綠體基因組測序。
2.測序平臺:
Illumina Novaseq
3.分析內容:
葉綠體基因組denovo組裝注釋、RNA編輯位點分析、核苷酸多樣性分析、Mauve分析、RSCU分析、SSRs分析、IR區收縮與擴擴張分析和全基因組進化樹構建。
研究結果
前胡屬葉綠體基因組特征
表1 前胡屬葉綠體基因組特征
對7個前胡屬基葉綠體基因組進行二代Illumina測序,測序產生了36,875,778-44,140,972條高質量reads,其中有712,889-6,125,929條reads用于后續的基因組組裝。葉綠體基因組大小范圍為142,494-156,899bp,基因組測序深度范圍為730.073X-6266.178X。它們都表現出典型的四分體結構,包括一對反向重復區域(IRs)、一個較大的單拷貝區域(LSC)和一個小的單拷貝區域(SSC)。12個葉綠體(7個本次測序+5個已發表的葉綠體基因組)基因組的GC含量介于37.4%-37.7%;12個葉綠體基因組編碼了113-114個特有基因,包括79-80個蛋白編碼基因,29-30個tRNA和4個rRNA基因。
圖1 7個前胡屬植物葉綠體基因組圈圖
為了分析葉綠體的密碼子使用情況,從每個葉綠體基因中提取了79個蛋白質編碼基因并進行連接。這些序列長度為66552 ~ 68130 bp,編碼22184 ~ 22710個密碼子。在所有葉綠體中,Leu的密碼子數量最多(2347 - 2404),而Cys的密碼子數量最少(234-243)。此外,12個葉綠體中所有密碼子的相對同義密碼子使用率在0.32 ~ 2.01之間。其中,30個密碼子的RSCU值均大于1.00,而RSCU > 1.00的密碼子AUA僅在P.insolens葉綠體基因組中。除UUG外,所有RSCU為> 1.00的密碼子均以A/U終止。
圖2 12個前胡屬葉綠體基因組的RSCU分析
本次分析檢測到12個葉綠體中35個蛋白質編碼基因中存在56-60個潛在的RNA編輯位點。所有檢測到的RNA編輯位點均為胞嘧啶到尿嘧啶(C-U)的轉換,且大部分發生在密碼子的第二位置(42-45),其次是第一個密碼子位置(12-16),但沒有發生在第三密碼子位置。此外,ndhB基因包含的RNA編輯位點數量最多,從10個到11個。
對12個葉綠體基因組進行SSRs分析,檢測到的SSRs總數為58 ~ 89個,大多數SSRs分布在所有葉綠體的LSC區域。在這些SSRs中,單核苷酸重復序列最多(28-54),其次是雙核苷酸重復序列(14-21)。此外,堿基A和T是12個葉綠體中所有SSR的主要成分。
圖3 12個前胡屬葉綠體基因組的SSRs分析
在12個Peucedanum葉綠體基因組中,IRa/SSC、IRb/SSC和IRb/LSC的邊界稍保守:大部分樣本IRa/SSC連接位于ycf1基因和ndhF基因之間,但在P . delavayi和P . angelicoides中擴展為ndhF基因;IRb/SSC的邊界屬于ycf1基因,大部分樣本的IRb/LSC邊界位于trnL和trnH基因之間。然而,前胡屬葉綠體IRa/LSC的連接是不同的,可分為4種不同類型。IRa/LSC連接在P . delavayi和P . angelicoides,屬于I型;在P . angelicoides中,IRa/LSC邊緣收縮到trnL-trnH基因間區(II型)。而P . mashanense Shan et Sheh和P . medicum DunnP.mashanense Shan轉移到rpl2-trnI的基因間區(三型);其余品種大部分的IRa/LSC邊界均屬于ycf2基因,而P. chujaense K. Kim, S.H. Oh, C.S. Kim & C.W. Park和P. terebinthaceum (Fisch.) Fisch. ex T urcz.則收縮于ycf2- trnl基因間區。
圖4 12個前胡屬葉綠體基因組的IR區收縮與擴張分析
除了在P . japonicum Thunb.和 P . medicum發現trnY-trnD-trnE基因倒置外,12個前胡屬葉綠體組的基因排列相對保守。然而,12份Peucedanum樣品的整個葉綠體序列相似性較低,在142197個比對位點中識別出7350個變異位點。根據序列的差異,選擇15個突變熱點區域作為候選DNA條形碼,包括Pi>0.01200的5個蛋白編碼基因 ccsA, matK, rpl22, rps8, ycf1和Pi >0.03100的10個非編碼區 ccsA-ndhD, ndhF-rpl32, petA-psbJ, psbA-trnK, rpl32-trnL, rps15-ycf1, rps2-rpoC2, trnH-psbA, trnK-rps16, ycf2-trnL。
圖5 12個前胡屬葉綠體基因組序列Mauve圖
圖6 12個前胡屬葉綠體基因組序列Mivasta圖
圖7 12個前胡屬葉綠體基因組核苷酸多樣性(Pi)值的比較分析
圖8顯示了系統發育過程,包括兩種支持值:BI后驗概率(PP)和ML bootstrap值(BS),這兩個分析都有力地支持了Peucedanum的成員不是單系聚在一起,而是分為四個分支:(1)P. insolens歸為弓翅芹屬(Arcuatopterus)分支;(2)P . delavayi與Pterygopleurum neurophyllum的姐妹支,屬于絲瓣芹屬(Acronema)分支;(3) P.angelicoides與Semenovia transiliensis Regel & Herder聚集在環翅芹亞族(T ordyliinae分支);(4)其余均屬于亮蛇床族Selineae。大部分的Peucedanum物種屬于Selineae,而這些樣本也沒有聚集在一個分支中。在賽林亞科中,鑒定出了三種主要的種系:(1)P . chujaense和P . terebinthaceum chujaense形成了一個與其他分支相對較遠的分支;(2)P . mashanense 和P . medicum形成一個分支;(3)其余的Peucedanum物種形成一個分支。此外,本研究推斷的非前胡屬物種間的系統發育關系與前人研究基本一致,本研究結果為這些關系提供了較高的支持值(所有節點的PP = 1.00, BS≥96)。
圖8 葉綠體基因組核進化樹構建分析
研究結論
1. 本研究是首次利用葉綠體葉綠體數據全面研究白豆屬植物葉綠體葉綠體特征并推斷系統發育的嘗試;
2. 比較分析發現,Peucedanum的葉綠體在基因組結構、密碼子偏好性、RNA編輯位點和SSRs方面較為保守,但在基因組大小、基因含量和排列、SC/IR邊界等方面存在差異;
3. 葉綠體系統發育分析結果表明,Peucedanum屬不是一個單系群;
4. 葉綠體中發現了15個突變熱點區域,這些熱點區域可以作為潛在的DNA條形碼用于物種鑒定;
5. 本研究為今后前胡屬植物的系統發育和分類學研究奠定了基礎。
本研究的denovo測序由上海派森諾生物科技有限公司完成。如需進一步討論,歡迎發郵件或者致電我們喲(郵箱地址:[email protected],聯系電話:025-58185663-836)!
文章索引:
Liu, CK., Lei, JQ., Jiang, QP. et al. The complete plastomes of seven Peucedanum plants: comparative and phylogenetic analyses for the Peucedanum genus. BMC Plant Biol 22, 101 (2022). https://doi.org/10.1186/s12870-022-03488-x