国产青榴社区91精品,久久成人精品免费播放,久久精品人人做人人试看

首頁> 關于我們 >新聞中心>技術分享>新聞詳情

轉錄組驗證序列哪里找

2020-09-11


相信不少小伙伴都遇到過這樣的疑惑:收到一份轉錄組測序結果,辛辛苦苦查找文獻,挖掘關鍵基因信息,眼看一篇高大上的文章即將誕生,卻卡在了進行qPCR驗證這最后一步:我關注的RNA序列在哪里?沒有序列信息我要怎么設計引物做熒光定量PCR呢?

莫慌,我們整理了派森諾各種常規轉錄測序產品的RNA序列信息,下面就一起來看看吧!


1、有參轉錄組

有參考基因組的轉錄組項目在進行分析時,我們是將測序reads與參考基因組進行比對,根據比對結果進行基因定量分析,進而進行差異分析的。從分析方法就可以發現,有參轉錄組的基因信息來自參考基因組,因此基因序列也是來自對應的數據庫。

那么,我們如何從數據庫中查找目標基因序列呢?我們整理了最常規的兩大數據庫:Ensembl和NCBI的基因序列查找方法,如果您的基因組也是來自這兩個數據庫,可點擊查看

干貨 |如何查找目標基因序列?掌握這幾招就夠了?。‥nsembl篇)(點擊查看)

干貨 | 如何查找目標基因序列?掌握這幾招就夠了?。∟CBI篇)(點擊查看)


2、無參轉錄組

無參考基因組的轉錄組項目在進行分析時,我們首先要基于測序結果拼接出一個“基因集”,并對其進行注釋,再將測序reads比對到這個基因集上,進而進行表達量分析和表達差異分析。

具體而言,我們首先利用Trinity軟件對高質量的測序reads進行從頭拼接,得到轉錄本序列,再對轉錄本進行聚類,挑選最長的轉錄本作為Unigene。Unigene的序列存放路徑:\report\result\1_RNASeq_Pretreat\Assembly

圖片7.png


另外,對于Unigene序列,我們使用Transdecoder軟件對其進行ORF(開放閱讀框)預測,從而得到CDS和蛋白序列,存放路徑:\report\result\6_Structure\ORF

圖片8.png



3、LncRNA

LncRNA為片段長度大于200nt的長鏈非編碼RNA。分析時,我們用Stringtie軟件利用Hisat2的比對結果來組裝轉錄本,在將鏈方向不確定的轉錄本去除之后,在剩下的組裝轉錄本集合中進行LncRNA的篩選,獲得候選LncRNA。然后我們利用三種軟件:PLEK、CNCI、Pfamscan,對這些候選LncRNA進行編碼潛能預測,三種軟件均判定為沒有編碼潛能的新轉錄本是高可信度LncRNA,可用于后續分析。

LncRNA序列存放路徑:\report\result\LncRNA\1_Novel_LncRNA

圖片9.png



4、CircRNA

CircRNA是一類特殊的非編碼RNA分子,與傳統的線性RNA(linear RNA,含5’和3’末端)不同,CircRNA分子呈封閉環狀結構,其首尾相連的“接頭”位置的序列由于來自相隔較遠的外顯子區域,直接比對基因組時存在大片段的缺口。利用這一特點,我們鑒定CircRNA時首先篩選未比對上參考基因組的測序reads,再截取兩端20bp作為Anchors序列再次比對到基因組上,用于檢測CircRNA。

CircRNA序列存放路徑:\report\result\CircRNA\1_CircRNA_Prediction

圖片10.png



5、miRNA

miRNA是一類長度在18-36nt之間的短鏈非編碼RNA,由于其序列較短,我們對它的獲取與鑒定是一般是基于一些miRNA數據庫,如miRBase進行的。

miRBase (http://www.mirbase.org/)是由曼徹斯特大學的研究人員開發的一個在線的miRNA數據庫,該數據庫中收錄了來自200多個物種、接近4萬個miRNA的信息,是最全面的miRNA數據庫。

對于被miRBase收錄的物種,我們分析時會下載該物種miRNA的前體和成熟體序列,然后將去重后的測序reads與其進行比對,從而對測到的miRNA進行注釋。對于這種miRNA測序項目,最簡單的獲取序列方式就是從miRBase中下載所有物種的miRNA序列,從中搜索目標miRNA的ID即可:

圖片11.png


對于未被miRBase收錄的物種,我們將去重后的測序reads與數據庫中所有動物(或植物)的成熟miRNA序列進行比對,從中篩選保守miRNA。

得到的保守miRNA序列存放路徑:\Results\03_Annotation\miRNA

圖片12.png


看到這里各位可能已經發現了,無論是哪一種RNA,似乎所有的序列文件都是以.fasta或.fa為后綴的,這是什么格式呢?我們應該用什么軟件打開呢?

在生物信息學中,FASTA格式(又稱為Pearson格式),是一種基于文本用于表示核苷酸序列或氨基酸序列的格式,可用文本編輯軟件打開,如UltraEdit 、EditPlus等軟件,系統自帶的記事本(txt)工具也可以。然后利用搜索功能查找序列ID,就可以輕松找到對應的序列啦!


圖片13.png

Ediplus搜索界面


圖片14.png

記事本搜索界面




主站蜘蛛池模板: 东乌珠穆沁旗| 阳原县| 金寨县| 沾化县| 五寨县| 砀山县| 太仓市| 吴桥县| 益阳市| 玉田县| 凤翔县| 天全县| 溧阳市| 修水县| 曲阳县| 工布江达县| 灌云县| 鄂尔多斯市| 五河县| 临邑县| 友谊县| 镇远县| 六盘水市| 尼玛县| 民勤县| 福海县| 额济纳旗| 蛟河市| 中超| 曲靖市| 连山| 福泉市| 泰顺县| 交口县| 普格县| 蛟河市| 时尚| 江阴市| 天镇县| 澄城县| 丹江口市|