计算空间的整个基因组的基因表达模式
尼古拉斯Rajewsky教授是一个有远见的人:他想要准确理解发生在人类细胞在疾病进展,能够识别和治疗目标的第一个细胞变化。“这就要求我们不仅要破译基因组在单个细胞的活动,但也跟踪空间在一个器官,”解释了科学研究所主任柏林医学系统生物学(BIMSB)马克斯·德尔布吕克分子医学中心(MDC)在柏林。例如,免疫细胞的空间安排在癌症(“微环境”)是非常重要的为了准确诊断疾病,选择最佳的治疗。“总的来说,我们缺乏一个系统的方法分子捕捉和理解(patho)生理组织。”
地图非常不同的组织类型
Rajewsky现在已经迈出了一大步朝着他的目标与主要的新研究已经发表在科学杂志《自然》上。一起从耶路撒冷希伯来大学的Nir弗里德曼教授,博士铁道部Nitzan剑桥哈佛大学美国,和Nikos Karaiskos博士项目领导者从自己的研究小组在“系统生物学基因调控元素”,科学家们已经成功地使用一种特殊的算法来创建一个空间映射的单个细胞的基因表达不同的组织类型:在哺乳动物的肝脏和肠道上皮细胞,以及在果蝇和斑马鱼胚胎,部分地区的小脑,肾脏。“有时纯粹理论科学足以发布在一个高级科学杂志——我认为这将在未来发生更频繁。我们需要更多的投资于机器学习和人工智能,”尼古拉斯Rajewsky说。
“使用这些生成的地图,我们现在能够精确地跟踪是否一个特定的基因活跃的细胞组织,“Karaiskos解释说,一个理论物理学家和bioinformatician铁道部Nitzan一起开发了算法。“这将不可能在这种形式没有我们的模型,我们叫‘novoSpaRc’。”
空间信息以前丢失
只有在最近几年,研究人员已经能够确定——大规模和精度高,单个细胞在一个器官或组织信息检索的基因组在任何给定的时间。这是由于新的测序方法,例如多路复用RNA序列,使大量的RNA分子同时进行分析。RNA在细胞基因变得活跃和蛋白质形成从他们的蓝图。Rajewsky公认的潜力单细胞测序,并建立在他的实验室。
“但这种技术工作,组织进行调查必须首先被分解成单个细胞,”Rajewsky解释道。这个过程会导致有价值的信息会丢失:例如,原始位置的特定的组织细胞基因活性基因解码。Rajewsky因此弗里德曼是寻找一种方法来使用数据从单细胞测序来开发一个数学模型,可以计算出空间的整个基因组的基因表达模式,即使在复杂的组织。
Rajewsky和罗伯特•Zinzen博士领导的团队也在BIMSB工作,两年前已经取得了第一次突破。在科学杂志《科学》上,他们提出了一个虚拟的果蝇胚胎模式。它显示哪些基因是活跃在细胞一个从未实现的空间分辨率。这个基因映射成为可能的帮助下84个标记基因:原位实验已经决定在蛋形胚胎这些基因是活跃在某个时间点上。研究人员证实了他们的模型与进一步复杂situexperiments生活果蝇胚胎。
一个谜与成千上万的碎片和颜色
“然而,在这个模型中,我们分别重建每个单元格的位置,“Karaiskos说。他是第一作者之一的“科学”研究和当前的“自然”的研究。“这是可能的,因为我们要处理一个相对较小的细胞和基因的数量。这一次,我们想知道是否我们可以重建复杂组织当我们几乎没有或根本没有先前的信息。我们能学到关于基因表达的原则是组织和管理复杂的组织?”The basic assumption for the algorithm was that when cells are neighbors, their gene activity is more or less alike. They retrieve more similar information from their genome than cells that are further apart.
为了验证这个假说,研究人员利用现有数据。肝脏、肾脏和肠道上皮细胞没有额外的信息。集团有能力收集只有几个标记基因通过重建的组织样本。在一个案例中,只有两个标记基因。
“这就像放在一起一个巨大的谜题与大量不同的颜色——也许10000年左右,“Karaiskos解释道,试图描述困难的任务时,他面临着计算模型。“如果正确地解决难题,所有这些颜色导致特定形状或图案。”Each piece of the puzzle represents a single cell of the tissue under investigation, and each color an active gene that was read by an RNA molecule.
测序技术的方法不管
“我们现在有一个方法,使我们能够创建一个虚拟的组织模型进行调查的基础上,从单细胞测序获得的数据在计算机——不管测序的方法,“Karaiskos说。“现有的单个细胞的空间位置信息可以输入模型,从而进一步完善它。”With the help of novoSpaRc, it is then possible to determine for each known gene where in the tissue the genetic material is active and being translated into a protein.
BIMSB Karaiskos和他的同事们也在关注使用模型来追溯,甚至预测某些组织或整个生物体发育过程。然而,科学家也承认可能会有一些特定的组织与novoSpaRc算法是不相容的。但这可能是一个受欢迎的挑战,他说:一个尝试的机会他的手在一个新的难题!
参考:Nitzan Karaiskos,弗里德曼和尼古拉斯Rajewsky》2019。基因表达制图。DOI: https://doi.org/10.1038/s41586 - 019 - 1773 - 3。
本文从以下转载材料。注:材料可能是长度和内容的编辑。为进一步的信息,请联系引用源。