国产青榴社区91精品,久久成人精品免费播放,久久精品人人做人人试看

首頁> 關于我們 >新聞中心>技術分享>新聞詳情

干貨 | EXCEL小技巧助力轉錄組數據挖掘

2020-01-07


2020年已經到啦,新年快樂!新的一年,順利拿到轉錄組測序結果的小伙伴們,趁著年關,都開始忙活起數據的深度挖掘了,這一開始搞數據,各種各樣的問題就隨之而來,比如:

哎呀,我找到的這些基因,怎么把它們對應的表達量,差異結果和注釋放在一張表里呢??

這個多組差異基因在一起的表格,沒有注釋呢,怎么加上去??

下面,咱們就來看看用EXCEL的函數,簡單快捷的實現,將多個表格里面,相同的基因ID對應的信息整理在一起。

1、首先通過差異倍數或者GO和KEGG的富集分析結果,挑選出一些目的基因,示例如下: 

圖片1.png 

 

2、添加表達量信息,打開expression表格,總表中是所有基因的reads count和FPKM,我們將FPKM添加到目的基因表格中:

圖片2.png

 

3、在1中的表格的B列,輸入=VLOOKUP(可以將不同表格對應起來的值,需要對應的信息所在的表格,對應后需要輸出的信息在表格的哪一列,匹配時使用精確匹配)

對應在表格中即為=VLOOKUP(A2(即1中的基因ID,因為兩個表格可以對應的是基因ID),[Expression.xlsx]Sheet1!$A:$F(需要對應的是Expression.xlsx表格的Sheet1的A-F列,也可以選擇全表),4(即需要輸出的是第一個樣本的FPKM值,該結果在選中的表達量的表格的區域,在第4列的位置),FALSE(即匹配時使用精確匹配))

圖片3.png 

這樣就可以直接目的基因在獲得KB樣本的FPKM值,同理可以在下一列輸入:

=VLOOKUP(A2(即1中的基因ID,因為兩個表格可以對應的是基因ID),[Expression.xlsx]Sheet1!$A:$F(需要對應的是Expression.xlsx表格的Sheet1的A-F列,也可以選擇全表),6(即需要輸出的是第二個樣本的FPKM值,該結果在選中的表達量的表格的區域,在第6列的位置),FALSE(即匹配時使用精確匹配)),從而獲得F列Gab樣本的FPKM:

圖片4.png

4、按照相同的方法,可以將基因的注釋也加入到第一部分的目的基因表格中,需要的信息在annotation表中的話,注釋表格如下:

圖片5.png

 

輸入:

=VLOOKUP(A2(即1中的基因ID,因為兩個表格可以對應的是基因ID),[Annotation.xlsx]Sheet1!$1:$1048576(需要對應的是Annotation.xlsx]表格的Sheet1的全表),7(即需要輸出的基因的名字,該結果在選中的表格的區域的第7列的位置),FALSE(即匹配時使用精確匹配))


圖片6.png 

 

5、第一行的第一個基因需要的信息均調取過來后,可以點擊單元格的右下角,出現“+“后,雙擊,即可獲得所有行的信息:

圖片7.png

  

按照以上的方法,基本可以實現同一個基因,在不同表格中的信息的調取,不管是表達量,注釋信息還是其他的對應信息都可以按照此方法操作,如此實用的技巧趕緊get起來!!


!!!但是需要注意的一點!!!

一定要保證,做對應關系的值,即上文所說的基因ID,也可以是其他的,像基因name等,該值在對應的需要搜索的表格中,即上述提到的表達量的表,注釋表,或者其他需要對應的表中,必須是選擇區域的第一列,如下面所示:

目標基因的信息提供的是gene name,需要調取的是基因的ID,

圖片8.png 

對應的注釋表格,應該將name放到需要的信息gene id的前面才可以使用。

圖片9.png

 

 

 


主站蜘蛛池模板: 双牌县| 贵州省| 马山县| 夏邑县| 富裕县| 宜丰县| 丰城市| 忻城县| 托里县| 东阳市| 宣武区| 岗巴县| 鱼台县| 满城县| 广州市| 鹤山市| 桃源县| 祁门县| 太康县| 胶南市| 安吉县| 商洛市| 阿鲁科尔沁旗| 五台县| 准格尔旗| 玉溪市| 阿拉善左旗| 屯留县| 阳西县| 全州县| 阳泉市| 麻江县| 德保县| 唐河县| 黄平县| 申扎县| 谷城县| 长子县| 融水| 澄城县| 肇东市|