新方法提供细胞活动的三维地图
正如在不了解上下文的情况下很难理解一段对话一样,生物学家在不了解细胞环境的情况下也很难把握基因表达的意义。为了解决这个问题,普林斯顿工程学院的研究人员开发了一种方法来阐明细胞的环境,这样生物学家就可以对基因表达信息有更多的意义。
研究人员由计算机科学本拉斐尔他们希望这个新系统能够为识别罕见细胞类型和选择精准的癌症治疗方案打开大门。拉斐尔是一个资深作者纸描述了5月16日发表的方法自然方法.
将基因表达与细胞环境联系起来的基本技术叫做空间转录组(ST)已经存在好几年了。科学家们将组织样本分解到一个微型网格上,并将网格上的每个点与基因表达的信息联系起来。问题是,目前的计算工具只能在二维上分析基因表达的空间模式。使用单个组织样本(如大脑、心脏或肿瘤的某个区域)的多个切片的实验很难合成组织中细胞类型的完整图像。
普林斯顿大学研究人员的方法被称为PASTE (ST实验的概率对齐),它整合了取自同一组织样本的多个切片的信息,提供了肿瘤或发育器官内基因表达的三维视图。当实验中的序列覆盖率由于技术或成本问题而受到限制时,PASTE还可以将来自多个组织切片的信息合并到一个具有更丰富基因表达信息的二维共识切片中。
Raphael说:“我们的方法是由于观察到生物学家经常会用同一个组织进行多个实验。”“现在,这些重复实验并不完全相同的细胞,但它们来自相同的组织,因此应该是高度相似的。”
该团队的技术可以对准来自单个组织样本的多个切片,根据细胞的基因表达谱对细胞进行分类,同时保留细胞在组织中的物理位置。
该项目开始于2020年夏天之后最大的土地,一个数学他是普林斯顿大学2021届毕业生,选修了拉斐尔的课程《计算生物学中的算法》。兰德对这个快速发展的领域感到兴奋,并有机会提高对人类健康和疾病的理解,他找到拉斐尔,希望参与研究,并开始编写代码,开发出后来的PASTE方法。拉斐尔和该研究的主要作者罗恩·泽拉(Ron Zeira)为他提供了建议。泽拉曾是普林斯顿大学的博士后研究员,现在是精准健康公司Verily的研究科学家。
这项工作是兰德毕业论文的重点,他与泽拉、拉斐尔和计算机科学博士生亚历山大·斯特扎尔科夫斯基共同撰写了这篇论文。兰德现在是纽约市纪念斯隆凯特琳癌症中心的计算生物学家,他说,泽拉和拉斐尔的指导对他追求研究生涯起到了重要作用。
该团队利用来自乳腺肿瘤空间转录组学研究的模拟基因表达数据开发了他们的方法,其中组织切片之间的对应关系之前已经建立。然后,他们对从大脑前额叶皮层样本收集的数据进行了评估,前额叶皮层有一个已知的结构,由具有独特基因表达特征的不同细胞类型层组成。
研究人员还将PASTE应用于从四名不同患者的皮肤癌活检中收集的数据。之前对这些数据的分析表明,细胞类型是复杂的拼凑,癌症细胞和健康细胞高度混合。然而,PASTE方法揭示了三个患者样本中明显的低空间相干性可能是由于实验中的低序列覆盖率。新的分析表明,细胞被分组成更连续的集群,这在生物学上更合理。
Zeira说:“在我们整合了几个这样的切片并有效地增加了数据的覆盖范围后,我们得到了更有空间一致性的细胞分组,这比在组织中随机定位每种细胞类型更合理。”
到目前为止,该团队分析的最大数据集是由9片心脏组织样本组成的,但他们的目标是对包括30多片的小鼠胚胎进行实验。Raphael说,除了计算方面的考虑,这种规模的空间转录组实验对许多实验室来说仍然昂贵。
不过,他补充说,“我们希望有一个像PASTE这样的工具,可以鼓励更多的研究人员进行重复实验,因为现在他们实际上可以用一种以前无法轻易做到的方式,使用来自其他切片的信息。”
这篇题为“空间转录组数据的校准和整合”的研究文章得到了美国国家癌症研究所的资助。
参考:泽拉,M,斯特扎尔考斯基,拉斐尔,BJ。空间转录组数据的校准和整合。Nat方法.2022.doi:10.1038 / s41592 - 022 - 01459 - 6
本文已从以下地方重新发布材料。注:材料的长度和内容可能经过编辑。如需进一步信息,请联系所引用的来源。