2020-01-07
2020年已經到啦,新年快樂!新的一年,順利拿到轉錄組測序結果的小伙伴們,趁著年關,都開始忙活起數據的深度挖掘了,這一開始搞數據,各種各樣的問題就隨之而來,比如:
哎呀,我找到的這些基因,怎么把它們對應的表達量,差異結果和注釋放在一張表里呢??
這個多組差異基因在一起的表格,沒有注釋呢,怎么加上去??
下面,咱們就來看看用EXCEL的函數,簡單快捷的實現,將多個表格里面,相同的基因ID對應的信息整理在一起。
1、首先通過差異倍數或者GO和KEGG的富集分析結果,挑選出一些目的基因,示例如下:
2、添加表達量信息,打開expression表格,總表中是所有基因的reads count和FPKM,我們將FPKM添加到目的基因表格中:
3、在1中的表格的B列,輸入=VLOOKUP(可以將不同表格對應起來的值,需要對應的信息所在的表格,對應后需要輸出的信息在表格的哪一列,匹配時使用精確匹配)
對應在表格中即為=VLOOKUP(A2(即1中的基因ID,因為兩個表格可以對應的是基因ID),[Expression.xlsx]Sheet1!$A:$F(需要對應的是Expression.xlsx表格的Sheet1的A-F列,也可以選擇全表),4(即需要輸出的是第一個樣本的FPKM值,該結果在選中的表達量的表格的區域,在第4列的位置),FALSE(即匹配時使用精確匹配))
這樣就可以直接目的基因在獲得KB樣本的FPKM值,同理可以在下一列輸入:
=VLOOKUP(A2(即1中的基因ID,因為兩個表格可以對應的是基因ID),[Expression.xlsx]Sheet1!$A:$F(需要對應的是Expression.xlsx表格的Sheet1的A-F列,也可以選擇全表),6(即需要輸出的是第二個樣本的FPKM值,該結果在選中的表達量的表格的區域,在第6列的位置),FALSE(即匹配時使用精確匹配)),從而獲得F列Gab樣本的FPKM:
4、按照相同的方法,可以將基因的注釋也加入到第一部分的目的基因表格中,需要的信息在annotation表中的話,注釋表格如下:
輸入:
=VLOOKUP(A2(即1中的基因ID,因為兩個表格可以對應的是基因ID),[Annotation.xlsx]Sheet1!$1:$1048576(需要對應的是Annotation.xlsx]表格的Sheet1的全表),7(即需要輸出的基因的名字,該結果在選中的表格的區域的第7列的位置),FALSE(即匹配時使用精確匹配))
5、第一行的第一個基因需要的信息均調取過來后,可以點擊單元格的右下角,出現“+“后,雙擊,即可獲得所有行的信息:
按照以上的方法,基本可以實現同一個基因,在不同表格中的信息的調取,不管是表達量,注釋信息還是其他的對應信息都可以按照此方法操作,如此實用的技巧趕緊get起來!!
!!!但是需要注意的一點!!!
一定要保證,做對應關系的值,即上文所說的基因ID,也可以是其他的,像基因name等,該值在對應的需要搜索的表格中,即上述提到的表達量的表,注釋表,或者其他需要對應的表中,必須是選擇區域的第一列,如下面所示:
目標基因的信息提供的是gene name,需要調取的是基因的ID,
對應的注釋表格,應該將name放到需要的信息gene id的前面才可以使用。