国产青榴社区91精品,久久成人精品免费播放,久久精品人人做人人试看

首頁> 關于我們 >新聞中心>技術分享>新聞詳情

干貨 | EXCEL小技巧助力轉錄組數據挖掘

2020-01-07


2020年已經到啦,新年快樂!新的一年,順利拿到轉錄組測序結果的小伙伴們,趁著年關,都開始忙活起數據的深度挖掘了,這一開始搞數據,各種各樣的問題就隨之而來,比如:

哎呀,我找到的這些基因,怎么把它們對應的表達量,差異結果和注釋放在一張表里呢??

這個多組差異基因在一起的表格,沒有注釋呢,怎么加上去??

下面,咱們就來看看用EXCEL的函數,簡單快捷的實現,將多個表格里面,相同的基因ID對應的信息整理在一起。

1、首先通過差異倍數或者GO和KEGG的富集分析結果,挑選出一些目的基因,示例如下: 

圖片1.png 

 

2、添加表達量信息,打開expression表格,總表中是所有基因的reads count和FPKM,我們將FPKM添加到目的基因表格中:

圖片2.png

 

3、在1中的表格的B列,輸入=VLOOKUP(可以將不同表格對應起來的值,需要對應的信息所在的表格,對應后需要輸出的信息在表格的哪一列,匹配時使用精確匹配)

對應在表格中即為=VLOOKUP(A2(即1中的基因ID,因為兩個表格可以對應的是基因ID),[Expression.xlsx]Sheet1!$A:$F(需要對應的是Expression.xlsx表格的Sheet1的A-F列,也可以選擇全表),4(即需要輸出的是第一個樣本的FPKM值,該結果在選中的表達量的表格的區域,在第4列的位置),FALSE(即匹配時使用精確匹配))

圖片3.png 

這樣就可以直接目的基因在獲得KB樣本的FPKM值,同理可以在下一列輸入:

=VLOOKUP(A2(即1中的基因ID,因為兩個表格可以對應的是基因ID),[Expression.xlsx]Sheet1!$A:$F(需要對應的是Expression.xlsx表格的Sheet1的A-F列,也可以選擇全表),6(即需要輸出的是第二個樣本的FPKM值,該結果在選中的表達量的表格的區域,在第6列的位置),FALSE(即匹配時使用精確匹配)),從而獲得F列Gab樣本的FPKM:

圖片4.png

4、按照相同的方法,可以將基因的注釋也加入到第一部分的目的基因表格中,需要的信息在annotation表中的話,注釋表格如下:

圖片5.png

 

輸入:

=VLOOKUP(A2(即1中的基因ID,因為兩個表格可以對應的是基因ID),[Annotation.xlsx]Sheet1!$1:$1048576(需要對應的是Annotation.xlsx]表格的Sheet1的全表),7(即需要輸出的基因的名字,該結果在選中的表格的區域的第7列的位置),FALSE(即匹配時使用精確匹配))


圖片6.png 

 

5、第一行的第一個基因需要的信息均調取過來后,可以點擊單元格的右下角,出現“+“后,雙擊,即可獲得所有行的信息:

圖片7.png

  

按照以上的方法,基本可以實現同一個基因,在不同表格中的信息的調取,不管是表達量,注釋信息還是其他的對應信息都可以按照此方法操作,如此實用的技巧趕緊get起來!!


!!!但是需要注意的一點!!!

一定要保證,做對應關系的值,即上文所說的基因ID,也可以是其他的,像基因name等,該值在對應的需要搜索的表格中,即上述提到的表達量的表,注釋表,或者其他需要對應的表中,必須是選擇區域的第一列,如下面所示:

目標基因的信息提供的是gene name,需要調取的是基因的ID,

圖片8.png 

對應的注釋表格,應該將name放到需要的信息gene id的前面才可以使用。

圖片9.png

 

 

 


主站蜘蛛池模板: 腾冲县| 峨眉山市| 淮阳县| 安顺市| 岳池县| 樟树市| 沙坪坝区| 宁乡县| 平阴县| 丹江口市| 余干县| 志丹县| 盐边县| 绥中县| 巴塘县| 张北县| 淮滨县| 邢台县| 万安县| 怀柔区| 上虞市| 鹤庆县| 漳平市| 祁东县| 乐业县| 阿坝县| 丰台区| 临猗县| 荔浦县| 延安市| 大同县| 保康县| 井研县| 卢氏县| 株洲县| 颍上县| 施甸县| 定南县| 门头沟区| 和田县| 金塔县|