
上个月,国际人类细胞图谱会议上刚刚发布HCA项目最新进展
当地时间13号,Broad研究所又发布新消息,Human Cell Atlas在线发布了50万人类免疫细胞的遗传图谱数据!
该数据集是同类研究中最大的数据之一,包括来自新生儿脐带血和成人骨髓近530,000免疫细胞的原始数据和相关元数据。Sanger研究所和合作者还提供了其他数据集。

这些数据为免疫细胞图谱奠定了基础,这是人类细胞图谱计划3000万个细胞初稿草图目标的重要的第一步。
“免疫系统非常复杂,涉及许多疾病,并分布于整个身体。这个数据集对于帮助解开其秘密至关重要,“血液学家Monika Kowalczyk称。
收集和处理50万个免疫细胞是一项非常艰巨的任务,涉及多个专业领域的紧密合作。
首先,Kowalczyk和她的在KCO(Klarman Cell Observatory)的同事Dionne,Michal Slyper和Julia Waldman从人类脐血和骨髓样品中分离出单个细胞,并进行测序。这需要非常周密的计划,该团队在20分钟的时间内处理了来自4名患者的224,000个细胞 ,是传统实验室通量的100倍以上。
然后,团队中的计算生物学家需要确定如何评估质量并分析这些海量的数据,现有的计算工具甚至无法满足分析需求。为处理这些数据,KCO的Orr Ashenberg和Regev实验室的Bo Li和Marcin Tabaka三人建立了新的计算方法,使用可公开提供的代码(如SCANPY)或由其同事Karthik Shekhar提供的代码进行工作。这些工具从测序数据中鉴定出例如细胞类型,发现了表征它们的特征基因并显示了特定细胞类型是如何从其他细胞中发育出来的。
最后,在发布大规模数据集之前,团队成员与Jane Lee合作,他为整个项目Stacey Donnelly和Andrea Saltzman协调后勤工作,以确保每个样本都有患者知情同意。在这个过程中,他们建立了一种未来能适用于其他样本的方法 - 包括108万脐带血,骨髓和白细胞,该团队与Broad研究院成员Nir Hacohen和Alexandra-Chloe Villani合作,数据已经处理完毕,一旦被批准,将会适时发布。
公开数据为科学界的研究人员提供了宝贵的资源。该数据集可以揭示基本的生物学问题,为研究疾病提供参考,并允许计算生物学家在大型数据集上测试新的分析工具。