转录组|单细胞多组学整合分析——突破以转录组来定义细胞类型的传统


转录组|单细胞多组学整合分析——突破以转录组来定义细胞类型的传统
责编 | 兮
近年来 , 单细胞转录组测序技术 (scRNA-seq) 日臻成熟 , 在解析人体免疫细胞多样性中发挥着至关重要的作用 , 但此方法也具有一定的局限性【1,2】 。 虽然该技术能够在异质组织中发现新的细胞类型和状态 , 但很难区分转录组相似而功能不同的免疫细胞 。 例如在T细胞中存在着大量功能各异的细胞群体 , 比如效应T细胞、调节T细胞、γδ T细胞和mucosal associated invariant T细胞等等 , 即便最灵敏的scRNA-seq技术也不能对其进行有效地辨识【3,4】 。 进而言之 , 因为某些细胞异质性的主要来源可能并不与转录组密切相关 , 使得仅靠转录组信息并不能准确地定义细胞状态 。
单细胞多组学技术(single-cell multimodal omics) 是指在同一细胞中同时测量多种组学数据的前沿技术【5】 。 例如最近开发的CITE-seq【6】 , 该技术是把特异性的寡核苷酸偶联到不同的抗体上 , 使其可以把对蛋白的测量转化为对抗体相连的DNA标签(ADTs)的测量 。 因此 , CITE-seq可以通过测序手段来获得同一细胞中的RNA和细胞表面蛋白的丰度 。 此外 , 随着新技术的进步 , 转录组已经可以与其他组学在单细胞水平上进行同步测量 。 这其中包括了ATAC【7,8】、DNA甲基化【9】、核小体分布【10】、空间位置【11,12】等等 , 它们都可以克服scRNA-seq固有的局限性 , 并可以进一步了解其他组学是如何影响细胞的状态和功能【5】 。 正是由于单细胞多组学技术的发展 , 如何整合不同数据类型的信息也变成了一个关键的问题 , 对单细胞多组学计算分析方法的需求也与日俱增 。

转录组|单细胞多组学整合分析——突破以转录组来定义细胞类型的传统
近日 , 纽约大学与纽约基因组中心的Rahul Satija和纽约基因组中心创新实验室Peter Smibert的联合团队(纽约大学博士生郝俞涵和纽约基因组中心创新实验室研究员Stephanie Hao为共同第一作者)在Cell杂志上发表了题为Integrated analysis of single-cell multimodal data的研究论文 。

转录组|单细胞多组学整合分析——突破以转录组来定义细胞类型的传统
在此项研究中 , 引入了“加权最近邻” (WNN) 分析框架 , 用于整合在一个细胞内测量的多组学数据 , 以获得细胞状态的联合定义 。 WNN是基于一种无监督策略的分析方法 , 首先通过多组学的交叉预测来计算细胞特异性的组学“权重” , 其可以反映每个组学信息内容的相对重要性 , 并借此来加权细胞之间的距离度量 , 进而获得单细胞多组学数据的WNN邻近构图(WNN graph) 。 尤其重要的是 , WNN邻近构图可用于绝大部分单细胞数据的下游分析任务 , 包括UMAP可视化、聚类分析和细胞拟时间序列构建 。 为了体现WNN方法可以在多种生物环境和数据类型中显著提高定义细胞状态的能力 , 研究人使用WNN分析了5个已公开发布的单细胞多组学数据:脐带血单核细胞CITE-seq【6】 , 骨髓单核细胞CITE-seq【13】 , 外周血单核细胞(PBMC)10x Multiome(RNA + ATAC)【14】 , 外周血单核细胞ASAP-seq(细胞表面蛋白+ ATAC)【15】 , 小鼠皮肤SHARE-seq(RNA + ATAC)【16】 。
与此同时 , 研究人员还利用CITE-seq技术以及优化的228个抗体组合 , 对21.1万个人体PBMC进行了单细胞多组学测序 , 随后使用WNN分析方法构建了一个人体PBMC多组学参考图谱 (human PBMC multimodal reference atlas) 。 在这个参考图谱中 , 研究人员鉴定了57个细胞亚群 , 其包括所有主要和次要免疫细胞类型 。 所有细胞大致分成了8类:CD4 + T细胞 (12亚群)、CD8 + T细胞 (12亚群)、非传统的T细胞 (7亚群)、NK细胞 (6亚群)、B细胞(8亚群)、树突细胞和单核细胞(8集群)、和其他罕见的细胞群(4类细胞:造血祖细胞、血小板、红细胞和循环先天淋巴样细胞) 。 为了方便读者使用参考图谱寻找细胞标志或设计特定细胞的FACS抗体组合 , 研究人员创建了一个简洁清晰的可视化网页(https://atlas.fredhutch.org/nygc/multimodal-pbmc/) 。
在构建人体PBMC多组学参考图谱的基础上 , 研究人员通过使用监督学习的主成分分析(supervised principal component analysis, SPCA)去计算出一种可以最大程度的代表WNN定义的联合细胞类型的转录组线性子空间【17】 。 再结合Seurat v3中的“锚定“策略【13】 , 提出了一种scRNA-seq数据的mapping方法 。 具体来说 , 由SPCA得到的转录组线性子空间可以提高在转录组水平上细胞类型识别的灵敏度和分辨度;其次“锚定“策略的应用可以消除新数据与参考图谱之间的批次效应 。 因此 , 这种单细胞mapping的方法 , 可以直接把新的scRNA-seq数据定位到多组学参考图谱上 , 来获得每个细胞的注释与其在参考图谱UMAP中的位置 , 就如同把测序中的DNA或RNA序列定位到参考基因组上 。 随后 , 研究人员通过另外一组最近公开的人体PBMC的CITE-seq数据验证了这种mapping方法的可靠性 【18】 。 最后 , 研究人员使用此方法整合了来自多个供体和疾病状态的PBMC 样本的scRNA-seq数据 , 并识别和验证人类淋巴细胞中的细胞异质状态 , 进而探索人类循环免疫系统如何应对新冠病毒的感染【19】 。 研究人员还创建了一个基于此mapping方法的网页应用程序 Azimuth(https://azimuth.hubmapconsortium.org/) 。 它可以帮助用户快速注释和可视化自己的数据集 。 Azimuth可以在5分钟内把5万个细胞的原始数据定位到参考图谱 , 获得细胞注释和UMAP 。 为研究各种疾病的机制 , 对人体PBMC进行单细胞测序已经变得越来越普遍 。 这就使得对这些单细胞数据进行自动、统一的注释变得更为重要 。 这样可以更清晰地描述复杂免疫反应 , 并发现潜在致病或有益于治疗的细胞亚群 。
经过上面的论述 , 研究人员其一是证明了 WNN分析方法可以有效地整合单细胞多组学数据 , 既突破了以转录组来定义细胞类型的传统 , 也开拓出了一种对于细胞类型、功能和行为进行联合定义的分析方法;其二是建立了人体循环免疫系统的多组学参考图谱 , 并且结合SPCA与Seurat v3“锚定”开发出scRNA-seq数据的mapping的方法 , 其使得任何人体PBMC的scRNA-seq数据可以直接定位到已构建的多组学参考图谱上 。
上述提到的方法均安装在开源 R 工具包 Seurat v4中(https://satijalab.org/seurat/) , 并可以在实验室网页上找到相应的参考教程(https://satijalab.org/seurat/articles/get_started.html/) 。

转录组|单细胞多组学整合分析——突破以转录组来定义细胞类型的传统
原文链接:
https://doi.org/10.1016/j.cell.2021.04.048
参考文献
1. Stubbington, M.J.T., et al., Single-cell transcriptomics to explore the immune system in health and disease. Science, 2017. 358(6359): p. 58-63.
2. Papalexi, E. and R. Satija, Single-cell RNA sequencing to explore immune cell heterogeneity. Nat Rev Immunol, 2018. 18(1): p. 35-45.
3. Ding, J., et al., Systematic comparison of single-cell and single-nucleus RNA-sequencing methods. Nat Biotechnol, 2020. 38(6): p. 737-746.
4. Mereu, E., et al., Benchmarking single-cell RNA-sequencing protocols for cell atlas projects. Nature Biotechnology, 2020: p. 1-9.
5. Zhu, C., S. Preissl, and B. Ren, Single-cell multimodal omics: the power of many. Nat Methods, 2020. 17(1): p. 11-14.
6. Stoeckius, M., et al., Simultaneous epitope and transcriptome measurement in single cells. Nat Methods, 2017. 14(9): p. 865-868.
7. Chen, S., B.B. Lake, and K. Zhang, High-throughput sequencing of the transcriptome and chromatin accessibility in the same cell. Nat Biotechnol, 2019. 37(12): p. 1452-1457.
8. Cao, J., et al., Joint profiling of chromatin accessibility and gene expression in thousands of single cells. Science, 2018. 361(6409): p. 1380-1385.
9. Gaiti, F., et al., Epigenetic evolution and lineage histories of chronic lymphocytic leukaemia. Nature, 2019. 569(7757): p. 576-580.
10. Clark, S.J., et al., scNMT-seq enables joint profiling of chromatin accessibility DNA methylation and transcription in single cells. Nat Commun, 2018. 9(1): p. 781.
11. Rodriques, S.G., et al., Slide-seq: A scalable technology for measuring genome-wide expression at high spatial resolution. Science, 2019. 363(6434): p. 1463-1467.
12. Vickovic, S., et al., High-definition spatial transcriptomics for in situ tissue profiling. Nat Methods,2019. 16(10): p. 987-990.
13. Stuart, T., et al., Comprehensive integration of single-cell data. Cell,2019. 177(7): p. 1888-1902. e21.
14. PBMCs from a healthy donor - granulocytes removed through cell sorting (10k), Single Cell Multiome ATAC + Gene Exp. Dataset by Cell Ranger ARC 1.0.0, 10x Genomics. 2020, September 9.
15. Mimitou, E.P., et al., Scalable, multimodal profiling of chromatin accessibility and protein levels in single cells. bioRxiv, 2020: p. 2020.09.08.286914.
16. Ma, S., et al., Chromatin Potential Identified by Shared Single-Cell Profiling of RNA and Chromatin. Cell, 2020. 183(4): p. 1103-1116.e20.
17. Barshan, E., et al., Supervised principal component analysis: Visualization, classification and regression on subspaces and submanifolds. Pattern Recognition, 2011. 44(7): p. 1357-1371.
18. Kotliarov, Y., et al., Broad immune activation underlies shared set point signatures for vaccine responsiveness in healthy individuals and disease activity in patients with lupus. Nat Med,2020. 26(4): p. 618-629.
【转录组|单细胞多组学整合分析——突破以转录组来定义细胞类型的传统】19. Wilk, A.J., et al., A single-cell atlas of the peripheral immune response in patients with severe COVID-19. Nat Med, 2020. 26(7): p. 1070-1076.

    推荐阅读