计算机模型识别驱动癌症生长的突变
癌细胞的DNA中可能有数千种突变。然而,真正推动癌症发展的只有少数;其余的人只是随波逐流。
区分这些有害的驱动突变和中性乘客可以帮助研究人员找到更好的药物靶点。为了促进这些努力,一个由麻省理工学院领导的团队建立了一个新的计算机模型,可以快速扫描癌细胞的整个基因组,并识别出比预期更频繁发生的突变,这表明它们正在推动肿瘤生长。这种类型的预测一直具有挑战性,因为一些基因组区域具有极高的乘客突变频率,淹没了实际司机的信号。
麻省理工学院研究生麦克斯韦尔·谢尔曼说:“我们创造了一种概率性的深度学习方法,使我们能够得到一个非常准确的模型,来计算基因组中任何地方应该存在的客突变的数量。”“然后我们可以在整个基因组中寻找突变意外积累的区域,这表明这些是驱动突变。”
在他们的新研究中,研究人员在整个基因组中发现了额外的突变,这些突变似乎有助于5%到10%的癌症患者的肿瘤生长。研究人员说,这些发现可以帮助医生找出更有可能成功治疗这些患者的药物。目前,至少30%的癌症患者没有检测到可用于指导治疗的驱动突变。
谢尔曼、麻省理工学院研究生亚当·亚里和前麻省理工学院研究助理奥利弗·普利比是这项研究的主要作者,该研究发表在今天的《科学》杂志上自然生物技术.麻省理工学院西蒙斯数学教授、计算机科学与人工智能实验室(CSAIL)计算与生物组负责人Bonnie Berger是该研究的资深作者,哈佛医学院助理教授、麻省理工学院和哈佛大学布罗德研究所副成员Po-Ru Loh也是该研究的资深作者。哈佛医学院和波士顿儿童医院的副教授菲利克斯·迪特莱因也是这篇论文的作者之一。
新工具
自20年前人类基因组测序以来,研究人员一直在研究基因组,试图找到导致细胞不受控制地生长或逃避免疫系统而导致癌症的突变。这已经成功地产生了表皮生长因子受体(EGFR)和BRAF(黑色素瘤的常见驱动因素)等靶标。EGFR通常在肺部肿瘤中发生突变。这两种突变现在都可以被特定的药物靶向。
虽然这些目标已经被证明是有用的,但蛋白质编码基因只占基因组的2%左右。另外98%的基因也含有可能发生在癌细胞中的突变,但要弄清楚这些突变是否会导致癌症的发生要困难得多。
伯杰说:“目前确实缺乏计算工具,使我们能够在蛋白质编码区域之外寻找这些驱动突变。”“这就是我们在这里试图做的事情:设计一种计算方法,让我们不仅看到2%的蛋白质编码基因组,而是100%的蛋白质编码。”
为了做到这一点,研究人员训练了一种被称为深度神经网络的计算模型,以搜索癌症基因组中比预期更频繁发生的突变。作为第一步,他们利用37种不同类型癌症的基因组数据训练模型,这使得模型能够确定每种癌症的背景突变率。
谢尔曼说:“我们的模型真正好的地方在于,你对特定类型的癌症进行一次训练,它就能同时了解这种特定类型癌症在整个基因组中所有地方的突变率。”“然后,你可以将你在患者队列中看到的突变与你预期看到的突变数量进行查询。”
用于训练模型的数据来自路线图表观基因组学项目和一个名为全基因组泛癌症分析(PCAWG)的国际数据集。该模型对这些数据的分析为研究人员提供了整个基因组的预期乘客突变率图,这样在任何一组区域(直到单个碱基对)的预期率都可以与在基因组中任何地方观察到的突变计数进行比较。
改变景观
利用这个模型,麻省理工学院的研究小组能够在已知的致癌突变图景中添加新的基因。目前,当对癌症患者的肿瘤进行致癌突变筛查时,大约三分之二的时间会出现一个已知的驱动因素。麻省理工学院研究的新结果为另外5%到10%的患者提供了可能的驱动突变。
研究人员关注的一种非编码突变被称为“隐性剪接突变”。大多数基因由编码蛋白质构建指令的外显子序列和内含子序列组成,内含子是一种间隔元件,通常在信使RNA被翻译成蛋白质之前被切掉。隐性剪接突变在内含子中被发现,在那里它们可以混淆剪接它们的细胞机制。这导致内含子在不应该被包含的时候被包含。
利用他们的模型,研究人员发现许多隐性剪接突变似乎会破坏肿瘤抑制基因。当这些突变存在时,肿瘤抑制因子被错误地拼接并停止工作,细胞就失去了对癌症的防御之一。研究人员在这项研究中发现的隐性剪接位点的数量约占肿瘤抑制基因中发现的驱动突变的5%。
研究人员说,针对这些突变可能提供一种潜在的治疗这些患者的新方法。一种可能的方法仍在开发中,使用被称为反义寡核苷酸(ASOs)的短链RNA,以正确的序列修补突变的DNA片段。
“如果你能让突变在某种程度上消失,那么你就解决了问题。这些肿瘤抑制基因可以继续发挥作用,也许可以对抗癌症,”Yaari说。“ASO技术正在积极开发中,这可能是一种非常好的应用。”
研究人员发现的另一个高浓度非编码驱动突变的区域是一些肿瘤抑制基因的非翻译区域。肿瘤抑制基因TP53在许多类型的癌症中都有缺陷,已经知道在这些序列中积累了许多缺失,被称为5 '未翻译区域。麻省理工学院的研究小组在一种名为ELF3的肿瘤抑制因子中发现了同样的模式。
研究人员还利用他们的模型调查了已知的常见突变是否也可能导致不同类型的癌症。例如,研究人员发现,先前与黑色素瘤有关的BRAF也有助于其他类型癌症(包括胰腺癌、肝癌和胃食管癌)的较小比例的癌症进展。
“这表明,普通司机和稀有司机的情况实际上有很多重叠。这为重新利用治疗提供了机会,”Sherman说。“这些结果可以帮助指导我们应该建立的临床试验,将这些药物从仅在一种癌症中获得批准,扩大到在许多癌症中获得批准,并能够帮助更多的患者。”
参考: Sherman MA, Yaari AU, Priebe O, Dietlein F, Loh PR, Berger B.体细胞突变率的全基因组图谱揭示了癌症的驱动因素。生物科技Nat》.2022:1-10。doi:10.1038 / s41587 - 022 - 01353 - 8
本文已从以下地方重新发布材料.注:材料的长度和内容可能经过编辑。如需进一步信息,请联系所引用的来源。