2024-10-29
號外~號外~細菌基因組數據NCBI上傳教程更新啦! 上傳教程千千萬,不如小派這一篇! 單樣本、多樣本基因組數據上傳全部輕松拿捏~ 咱們廢話不多說,直接上超詳細干貨 基本流程
一、NCBI注冊及上傳
1、注冊網站: https://www.ncbi.nlm.nih.gov/account/register/?back_url=http%3A%2F%2Fwww.ncbi.nlm.nih.gov%2Fhome%2Fsubmit.shtml&partners-uri=cms:/account/partners 打開NCBI注冊網站,選擇第三方平臺進行注冊登錄 2、進入提交頁面 打開NCBI官網https://www.ncbi.nlm.nih.gov/,輸入賬號和密碼,點擊網頁上的Submit欄可進入GenBank界面,找到細菌基因組提交欄,點擊進入即可開始本次的提交(或直接點擊https://submit.ncbi.nlm.nih.gov/subs/genome/進入提交界面)。 具體步驟如下: 3、點擊New submission進入,此步操作可以得到SUB號;
Part 01、單樣本基因組上傳
二、基本信息填寫
1、單個樣本基因組上傳——選擇Single genome,點擊continue; 2、進入SUBMITTER完善個人信息,帶*為必填項,填寫完點擊continue。此處的郵箱不建議使用qq郵箱、163郵箱和foxmail郵箱; 3、General Information信息填寫(此處以未申請BioProject和BioSample號為例,如果已經申請過可以直接將對應的BioProject和BioSample號直接填寫即可): (1)BioProject和BioSample處選擇NO,釋放數據日期可根據自己的需要來進行選擇; (2)組裝和測序信息填寫(組裝軟件及版本可在結題報告附錄-軟件列表查看): 細菌框架圖項目的組裝軟件:spades,版本v3.15.4 細菌完成圖項目的組裝軟件:Fyle,版本v2.9.1-b1781;Unicycler,版本 v0.5.0; (3)測序深度及測序平臺的選擇: 測序深度=測序數據量/基因組大小(可在結題報告-二代測序數據過濾部分查看); 測序平臺:二代一般為Illumina Novaseq平臺,三代一般為Pacbio/Nanopore平臺(可在結題報告-文庫信息部分查看); (4)填寫基因組的組裝信息以及是否有關聯的文章,填寫完成后點擊Continue進入下一步;
三、BioProject信息填寫
菌株英文描述(大概100個左右word ):描述下該菌株進行全基因組測序的目的、意義及用途(工業/農業/醫療等等)等信息(共性\不同),填寫完成后點擊Continue進入下一步;
四、BioSample信息填寫
1.選擇Microbe,點擊Continue進入下一步; 2.BioSample Attributes:填寫物種拉丁名稱及菌株名;菌株的來源,保存單位(xxx單位分離及分離信息 xxx單位保存或 xxx保藏中心保存)和樣本收集時間; 3.source:是否需要NCBI注釋——選擇Yes;
五、Sequence上傳,信息填寫
1.Files:細菌完成圖如果只組裝出一條染色體,沒有質粒可選擇選項1;細菌框架圖組裝出多條scaffold或細菌完成圖組裝出了多條完整的染色體/質??蛇x擇選項2; 2.選擇網頁版上傳,并將基因組中的染色體和質粒的fasta文件全部上傳(細菌完成圖上傳Assembly文件夾*.fasta文件,細菌框架圖上傳Assembly文件夾*.scaffolds.fna文件),上傳后點擊Continue進入下一步; 3.Assignment:需要確認組裝得到的染色體有幾條、是否含有質粒,染色體和質粒是否為完整的環狀的,以及Sequence ID需要與fasta文件中>后名字一致。在提交質粒信息的時候,質粒的命名為以“P”開頭的名字或者命名為unnamed、unnamed1...... 4.填寫作者名字及排序,以及該基因組是否有相關聯的文章,點擊Continue進入下一步;
六、數據提交
核查已填入的信息是否有誤,有問題的話返回對應的界面進行修改,確認無誤后點擊Submit完成本次NCBI上傳。一般上傳一個星期內NCBI會發郵件到郵箱,給出相應的登錄號,這個登錄號可直接用于后續的文章中。
Part 02、多樣本基因組上傳(針對于細菌框架圖樣本)
1、多個樣本基因組上傳——選擇Batch/multiple genomes,點擊continue; 2、Gap信息填寫 3、BioProject General Info 4、Publications 5、Biosample Type 6、Attributes 7、Genome Info (1)填寫基因組信息 (2)組裝和測序信息填寫(組裝軟件及版本可在結題報告附錄-軟件列表查看) 8、Files:選擇網頁版上傳,并將基因組中的fasta文件全部上傳(細菌完成圖上傳Assembly文件夾*.fasta文件,細菌框架圖上傳Assembly文件夾*.scaffolds.fna文件),上傳后點擊Continue進入下一步; 9、References:填寫作者名字及排序,以及該基因組是否有相關聯的文章,點擊Continue進入下一步; 核查已填入的信息是否有誤,有問題的話返回對應的界面進行修改,確認無誤后點擊Submit完成本次NCBI上傳。一般上傳一個星期內NCBI會發郵件到郵箱,給出相應的登錄號,這個登錄號可直接用于后續的文章中。
以上就是細菌基因組上傳至NCBI的詳細步驟,是不是已經學會了?趕快用自己的數據來試試吧!如果大家在上傳過程中有任何疑問,歡迎隨時和我們一起探討,可在文末留言或者郵件交流([email protected])。