2024-08-05
SRA(Sequence Read Archive)作為NCBI用于保存大規模測序原始數據的數據庫,也是絕大多數轉錄組文章上傳原始數據的較優選擇。這里我們整理了單細胞轉錄組原始數據上傳SRA的超簡單方法,5分鐘讓你成為平(fei)平(chang)無(li)奇(hai)的數據上傳小天才!
1.NCBI登錄
1.1 進入網址:https://www.ncbi.nlm.nih.gov/,然后點擊右上角的log in進行登錄;
1.2 如果您沒有NCBI的賬號,可以進行申請,或者使用其他登錄方式:
1.3 登錄完成后依次點擊submit,如下:
1.4 點擊new submission,創建新的上傳任務單;
2.信息填寫
2.1 接下來就是信息填寫了,只要根據網站提示填寫相應內容即可。首先是個人信息,*為必填選項,包括名字,郵箱(這里盡量不要使用qq郵箱,以避免無法正常接收郵件),以及學校信息等,填寫完成后點擊繼續。
2.2 接下來填寫General Information,這里主要填寫是否已經注冊BioProject和BioSample的信息,沒有申請直接選擇NO即可。另外可以根據您的需要,選擇數據是上傳后立即公布,還是指定日期公布,填寫完成后點擊繼續。
2.3 之后填寫項目信息,*為必填項,填寫項目標題及項目信息,根據老師的項目情況及實驗處理進行填寫即可。非必填內容可以直接跳過,點擊continue繼續。
2.4 選擇樣本類型,如植物、動物、人、細菌等,這里我們以人類Human為例,選好后點擊continue繼續。
2.5 接下來需要提交BioSample attributes,這里有在線填寫和下載表格填寫兩種方式。這里我們推薦下載表格填寫。
所有的信息根據提示及項目情況進行填寫即可。綠色字段為必填項,如缺少相關信息,如任何必填項沒有資料,可以填寫'not collected', 'not applicable' 或 'missing';;黃色字段則為非必填項。(注意,這里信息如果填寫不符合規范,上傳后會報錯,只需根據提示的信息對表格內容進行相應修改后重新上傳即可)。
2.6 下一步輸入SRA Metadata信息,還是可以選擇線上填寫或下載表格填寫,這里還是以表格填寫為例。參照示例填寫相關信息后,點擊continue繼續。
以人類肝臟空轉舉例,單細胞或空間轉錄組數據在紅框部分選擇如截圖所示即可,測序儀器和型號可咨詢公司確定,其他樣本信息可自行填寫;
File name就是原始數據的名稱,雙端測序應該有R1和R2兩個名字;
3.數據上傳
3.1 終于到了最后一步上傳數據啦!老師根據自己的數據情況,選擇適合的上傳方式即可。如果數據較少,可以選擇直接網頁上傳;單細胞轉錄組數據一般較大,這里推薦Aspera方法上傳數據:
3.2 準備好原始數據,原始數據都是xxx.fastq格式;
3.3 準備Aspera上傳所需相關文件;
軟件下載路徑和操作步驟ncbi頁面上都會有(請看下面截圖),以下是中文操作步驟:
1)下載key file文件(一般會是一個aspera.openssh文件),放在一個固定的位置。
2)在本地找到ascp.exe程序位置。可以先在應用里找到Aspera Connect軟件,右鍵點擊“屬性”找到Aspera Connect快捷方式,再次右鍵點擊“屬性”進入,里面會看到有ascp.exe程序。
比如我的是在C:\Users\psn\AppData\Local\Programs\IBM\Aspera Connect\bin里面。
3)在這個文件夾里面(ascp.exe程序所在位置文件夾),在文件夾的空白處,按住shift鍵 同時鼠標右擊,打開power shell命令窗口。然后輸入命令行(ncbi頁面上的):ascp.exe -i <key_file< font="">文件所在路徑> -QT -l100m -k1 -d <需要上傳的原始數據所在路徑> [email protected]:uploads/caihong.song_outlook.com_I6Ezp1wv
舉例我的:
.\ascp.exe -i V:\tmp\202402\AAA_ST-seq\aspera.openssh -QT -l100m -k1 -d V:\tmp\202402\AAA_ST-seq\rawdata [email protected]:uploads/caihong.song_outlook.com_I6Ezp1wv
注意:輸入的命令行就是ncbi頁面上的命令行,注意最前面要額外加上.\。每個人的都不一樣,只是需要把標黃標綠的位置,替換成我們存放這些文件的位置路徑即可。
4)然后數據就會自動上傳了,顯示100%時表明上傳完畢;
5)數據上傳成功后,最后一步檢查一下上傳信息是否有誤,確定沒問題的話點擊submit,我們的上傳工作就完成啦,接下來就靜靜的等待NCBI發送郵件給我們了。
注意:如果數據上傳中出現了無法修改的錯誤,或遲遲沒有審核完成的情況,大家都可以發郵件給NCBI進行咨詢。
本期單細胞轉錄組原始數據SRA上傳教學已結束,大家都學會了嗎?