2018-11-07
文案 | 動植物基因組事業(yè)部
在基于SNP等分子標記的群體遺傳進化分析中,有時會產(chǎn)生構(gòu)建的系統(tǒng)發(fā)育樹與預(yù)期不符的情況,包括分子系統(tǒng)樹與基于表型的系統(tǒng)樹不符、與基于氨基酸序列的系統(tǒng)樹不符、與基于葉綠體/線粒體序列的系統(tǒng)樹不符等情況。對于這一類情況,排除采樣和測序造成的誤差,我們需要考察造成這種現(xiàn)象的原因,并針對不同原因找到解決方法。
通常情況下,可能的原因有趨同進化、ILS效應(yīng)、長枝吸引效應(yīng)等。
趨同進化
趨同進化是指是指親緣關(guān)系較遠的生物,由于生活環(huán)境、生活方式相似而在長期的適應(yīng)過程中所形成的體形或器官等異常相似的現(xiàn)象。通常情況下,氨基酸序列比核苷酸序列更容易受到趨同進化的影響。因此可能造成核苷酸進化樹與氨基酸進化樹不一致的情況。
圖1: 基于DNA序列(A)與基于蛋白序列(B)的進化樹不一致;海豚與蝙蝠在蛋白樹中聚類到一起但在DNA樹中沒有聚在一起
為了進一步鑒定趨同進化的信號,可以采用選擇壓力分析或祖先序列與現(xiàn)存序列比較等方法。例如,在選擇壓力分析中,通過計算非同義突變與同義突變率(ω),鑒定位點受選擇的情況(ω接近0:純化選擇;ω大于1:正向選擇)。趨同進化位點的ω>1且與氨基酸進化樹顯著相關(guān)。
圖2:縱軸表示對基因樹的支持率,橫軸表示ω值;綠點為趨同進化信號位點,藍點受到純化選擇,紅點受到中性選擇
ILS效應(yīng)
不完全譜系分類(incomplete lineage sorting, ILS)是指基于單個基因的系統(tǒng)樹與基于物種或群體的系統(tǒng)樹不一致的現(xiàn)象。當(dāng)一個具有等位基因多態(tài)性的祖先種分化為兩個類群時,兩個等位基因在后代群體中都得到了保留,當(dāng)后代群體進一步分化時,該基因的系統(tǒng)發(fā)育關(guān)系可能與物種進化關(guān)系不符。
圖3:基于不同基因組片段構(gòu)建進化樹間不一致
ILS效應(yīng)常由于物種快速形成,或經(jīng)歷了快速分化,單個基因的水平上沒有演化出足夠多的序列差異造成。
為了檢測ILS效應(yīng),可對全部SNP使用非重疊滑窗法或抽樣法生成若干SNP子集,基于每個子集的SNP分別構(gòu)建進化樹,即基因樹。若存在ILS效應(yīng),不同基因樹的拓撲結(jié)構(gòu)之間將存在嚴重的不一致現(xiàn)象。在這種情況下,可整合全部基因樹,計算每個分枝上支持不同拓撲結(jié)構(gòu)的SNP的比例,從而證明ILS的作用大小。
長枝吸引效應(yīng)
系統(tǒng)發(fā)育分析中,“長枝吸引”(Long-branch Attraction, LBA)假象是最為困擾研究者的問題。“長枝吸引”假象由Felsenstein(1978)首次提出,是指在用系統(tǒng)發(fā)育分析方法分析一個有限數(shù)據(jù)集時,由于高頻率的相似變化(如趨同、平行進化)和加速的進化速率等因素的存在,使序列達到相同狀態(tài),從而人為地將這些不是來自于共同祖先的序列的代表分類元聚在一起,使這些分類元之間相互“吸引”。
圖4:無根樹和有根樹的長枝吸引
因此,在進行系統(tǒng)發(fā)育分析時,應(yīng)盡可能避免“長枝吸引”假象的產(chǎn)生,從而構(gòu)建出可靠的系統(tǒng)發(fā)育樹。
圖5:小孢子蟲的線粒體和核糖體系統(tǒng)樹的長枝吸引,示Microsporidia, Trichomonadida, Euglenozoa三個群體的rDNA樹有錯位現(xiàn)象
有研究表明似然法不容易產(chǎn)生“長枝吸引”現(xiàn)象,但并不絕對,因此需要將幾種方法結(jié)合使用來避免“長枝吸引”。
? 模型優(yōu)化法:分析中考慮位點替換速率的異質(zhì)性,通過設(shè)定gamma分布參數(shù)優(yōu)化核苷酸替換模型;
? 排除法:包括剔除序列中第三密碼子位點、剔除分類群中進化速率較快的長枝分類元等;
? 打斷法:增加與長枝分類元關(guān)系近的分類元以打斷長枝;
? 無關(guān)聯(lián)數(shù)據(jù)整合分析法:如結(jié)合形態(tài)和分子兩方面的數(shù)據(jù)聯(lián)合分析。
看了以上內(nèi)容,仍然覺得意猶未盡?
歡迎關(guān)注
(? 點擊下方標題跳轉(zhuǎn)詳情)
(上海,2018年11月14日~16日)
在這里,你可以:
參加培訓(xùn)課程,掌握群體進化分析流程
與生信分析工程師面對面交流,解決你的分析相關(guān)問題
參觀派森諾工作環(huán)境,體驗生信分析工作氛圍
培訓(xùn)內(nèi)容
參考文獻
[1].Shen, Y-Y, Liang, L, Li, G-S, Murphy, RW, and Zhang, Y-P (2012) Parallel Evolution of Auditory Genes for Echolocation in Bats and Toothed Whales. PLoS Genetics 8(6): e1002788. doi:10.1371/journal.pgen.1002788
[2].Liu Y, Cotton J A, Shen B, et al. Convergent sequence evolution between echolocating bats and dolphins[J]. Current Biology, 2010, 20(2):R53-R54.
[3].Scornavacca C, Galtier N. Incomplete Lineage Sorting in Mammalian Phylogenomics.[J]. Systematic Biology, 2016, 66(1):syw082.
[4].Bergsten J. A review of long-branch attraction[J]. Cladistics-the International Journal of the Willi Hennig Society, 2010, 21(2):163-193.
[5].Philippe H. Opinion: long branch attraction and protist phylogeny[J]. Protist, 2000, 151(4):307-316.