2023-03-02
當跑完常規的細胞過濾,拿到單細胞測序數據后,緊接著就是做細胞類型鑒定,如果這一步不準確,那么后續所有分析都是不可靠的。我們知道使用各類marker gene進行專業的人工注釋是細胞注釋的金標準,但是其過程是緩慢和比較繁重的,而且可能是主觀的。在對大量數據集開展具體的鑒定之前,我們還是希望能有一些自動化的軟件給我們的鑒定工作提供一些指引和參考,本期文章就是向大家介紹一些輔助我們的自動化注釋軟件,加快我們的科研速度!
1、SingleR 相信這個軟件大家都已熟悉,可能是目前應用較為廣泛比較被認可的注釋軟件,如此耳熟能詳可能讓很多人誤以為它已有悠久的歷史,但實際上這款軟件于2019年一篇發在Nature Immunology上的文章面世,也才4年時間。SingleR是一款R包,內置的背景數據庫包含人和小鼠兩種物種的數據,5個人的數據庫HumanPrimaryCellAtlasData、BlueprintEncodeData、DatabaseImmuneCellExpressionData、MonacoImmuneData、NovershternHematopoieticData;2個小鼠的數據庫ImmGenData、MouseRNAseqData所以分析工作也主要針對這2個物種來進行。 (參考文獻:Reference-based analysis of lungsingle-cell sequencing reveals a transitional profibrotic macrophage. NatureImmunology, 2019)原理示意圖: 2、scCATCH 相比于SingleR,scCATCH的結果會有一定的差異,這種差異在一些研究較少的細胞類群上體現的尤為明顯,同時對于可能難以區分的細胞,scCATCH會比較實誠地標注上unknown,而不是像SingleR一樣一定要迭代出一個最相近的結果出來。 (參考文獻:scCATCH: Automatic Annotation onCell Types of Clusters from Single-Cell RNA Sequencing Data. iScience, 2020.)注釋工作原理圖解: 3、Garnett Garnett是一個單細胞自動注釋軟件包,輸入數據包括一個單細胞數據集和細胞類型定義文件。Garnett使用彈性網回歸模型的機器學習算法訓練出一個基于回歸的分類器。隨后訓練好的分類器就可以用于更多數據集的細胞類型定義。Garnett的工作方式是獲取單細胞數據和細胞類型定義(marker)文件,并訓練一個基于回歸的分類器。一旦被訓練成一個針對某一組織/樣本類型的一個分類器,它就可以應用于從相似組織中對未來的數據集進行分類。 (參考文獻:Supervised classification enablesrapid annotation of cell atlases.Nature Methods, 2019.) 4、CellAssign 基于marker基因的信息自動將單細胞RNA-seq數據分配注釋到已知的細胞類型中。它以marker基因的細胞類型矩陣作為輸入,提供先驗的已知marker基因是否屬于某種細胞類型。然后,cellassign會概率性地將每個細胞分配給一個細胞類型,從而消除了典型無監督聚類中的主觀偏見。 (參考文獻:Probabilistic cell-type assignment of single-cell RNA-seq for tumor microenvironment profiling) 5、Cell Blast Cell BLAST是一個自帶高質量參考數據庫的scRNA-seq數據檢索/注釋工具。這個網站由北京大學的研究團隊研發,論文發表在在《Nature Communications》:基于深度學習模型的scRNA-seq數據檢索和注釋的新方法Cell BLAST,以及具備高質量注釋的scRNA-seq參考數據庫ACA。這一數據庫為有效利用現有數據進行細胞注釋和跨數據集研究提供了新的工具和資源。 (參考文獻:Searching large-scale scRNA-seqdatabases via unbiased cell embedding with Cell BLAST.Nature Communications, 2020.) 從第一款單細胞自動注釋軟件在2019年面世以來,短短的4年時間里已經有幾十款同類軟件了。自動注釋的軟件對于我們的研究工作能夠起到一定的先導意義,不過這種先導意義一定是建立在對分析過程的理解之上的,不能夠進行生搬硬套。以上是本期為大家介紹的常見的幾款,如果你也正在從事單細胞數據分析的相關工作并且正在入門的階段徘徊,不妨試一試這幾種自動注釋的軟件,也許它們會給你提供一些思路。