使用机器学习增强癌症免疫治疗的生物标志物
肿瘤细胞的避免免疫系统破坏的能力是核心之一癌症的特征.免疫系统的目标是通过人类白细胞抗原(HLA)在细胞表面呈现肿瘤新抗原来识别和消除它认为是“非我”的恶性细胞。
HLA- loh (loss of heterozygosity, HLA- loh)是发生在某些癌细胞中的一种现象,有助于癌细胞逃避免疫系统的检测。编码抗原呈递机制的HLA等位基因从这些细胞的基因组中被删除,有效地隐藏了免疫系统的检测。随着免疫检查点抑制剂等免疫疗法的成功,了解癌症中的免疫逃避比以往任何时候都更加重要。然而,尽管HLA-LOH鉴定在预测免疫治疗反应方面具有重要意义,但目前几乎没有准确的检测方法。
生物科技公司Personalis最近在自然通讯详细介绍了一种新的机器学习算法,能够从全外显子组测序数据中检测HLA LOH。这种新的机器学习方法——命名为DASH(缺失等位基因特异性HLAs)——利用配对正常组织和肿瘤组织的数据检测HLA-LOH,目的是促进HLA-LOH作为癌症免疫治疗的生物标志物的使用。
为了了解更多关于DASH及其应用,我们采访了雷切尔·马蒂·派克博士他是Personalis公司生物信息学经理,也是这篇论文的主要作者。
Sarah Whelan (SW):你解释了HLA LOH对癌细胞逃避免疫识别很重要——肿瘤中的免疫逃逸有多重要,它如何影响免疫治疗的潜在应用?
瑞秋·马蒂·派克博士(RMP):在过去的半个世纪里,肿瘤免疫编辑的证据一直在建立,导致在“癌症的特征”之外又增加了“逃避免疫破坏”。免疫编辑是指免疫细胞攻击并杀死具有免疫原性的癌症克隆体,留下较少的免疫原性或隐藏的克隆体来生存和生长。以下是文献中的一些亮点:
- Chowell等人发表了两篇论文(科学2017而且自然医学2019)表明,编码主要组织相容性复合体(MHCs)的HLA基因的种系变异减少,导致对检查点封锁免疫治疗的反应较差,这表明缺乏新抗原的多样性可以促进免疫逃逸,并导致患者的预后较差。
- 就在过去的一个月里,有两个很棒的自然定量免疫编辑的论文显示热点突变在致癌性和免疫原性之间达到了最佳平衡(Hoyos等人。而且Luksza等。).
文献表明,免疫逃逸的必要性塑造了肿瘤的进化和影响患者的预后-两个关键领域!
免疫疗法的工作原理是使患者的免疫系统对肿瘤增敏或再增敏,使其攻击并杀死肿瘤。免疫逃逸可以通过几种方式干扰这一过程:
- 减少肿瘤呈现的免疫原性新抗原会导致免疫系统的靶点减少,使检查点抑制剂的效果降低。
- 破坏抗原提呈机制(如HLA)可以阻止所有或特定抗原的提呈,使得检查点疗法、个性化癌症疫苗和过继T细胞疗法都不那么有效。
- 肿瘤经常上调检查点来阻止t细胞的攻击。个性化的癌症疫苗无法单独克服这种免疫逃逸方法,迫使检查点抑制剂联合疗法的兴起。
斯蒂芬尼:你能简要地总结一下这种新开发的技术DASH是如何工作的吗?
RMP:DASH依赖于输入来自患者的肿瘤和正常DNA的高质量外显子组测序。而我们设计的方法是用于hla富集的ImmunoID NeXT平台®,我们还证明了该方法在其他外显子上仍然有效,只是性能略有下降。根据外显子组测序数据,进行HLA分型,肿瘤和正常读数与患者特异性HLA参考相匹配。然后,计算7个特征,并将其作为an的输入XGBoost机器学习模型,检测HLA LOH在特定基因。
模型的性能取决于模型的特性。我们致力于量化HLA区域与基因组其他部分的不同之处。我们的两个独特之处是:
- 修改b等位基因频率。b-等位基因通常是指两个等位基因- A和b的非参考等位基因,b-等位基因频率是指两个等位基因在微阵列上的强度比。在我们的例子中,我们用它来表示两个等位基因之间的序列深度比。大多数拷贝数检测算法将使用b等位基因频率来了解是否存在等位基因不平衡。然而,由于HLA区域的复杂性,探针捕获的质量可能因特定等位基因而异。为了克服这一障碍,我们通过正常DNA将b等位基因频率归一化,以解释这些探针偏差。
- 侧翼地区。HLA基因相对较短,有时同源等位基因之间很少有基因组差异。为了增加我们对呼叫的敏感性和信心,我们利用了HLA基因周围区域的信息。
斯蒂芬尼:开发这项新技术的主要目标是什么?
RMP:我们有两个重点。首先,我们希望针对HLA区域调整方法,因此我们专注于设计能够捕捉HLA区域所呈现的独特挑战的特征(如上所述)。其次,我们希望开发正交方法来真正理解该方法的性能。
西南:在开发这项新技术的过程中,你遇到过什么挑战吗?
RMP:我们在这个项目中面临的大部分挑战都围绕着DASH的验证。我们采用了三种主要的验证方法在网上细胞系稀释,患者特异性数字聚合酶链反应(PCR)和功能性免疫肽组学。
执行在网上为了量化我们方法的检测限度,我们必须分析几十个细胞系来找到HLA LOH。由于HLA基因的复杂性和多样性,我们必须设计等位基因特异性的、患者特异性的引物,用数字PCR评估缺失。我们经过了几次迭代,为每个病人找到了能给出干净信号的最佳引物。最后,我们发现定量免疫肽组学方法验证是非常具有挑战性的。虽然我们希望在本节中显示稳健的验证结果,但我们发现该方法的信号有限。我们假设了这一发现的几个原因,但可能需要另一篇研究论文才能真正了解这些限制是技术上的还是生物学上的。
DASH与LOHHLA(人类白细胞抗原杂合性缺失)相比如何,LOHHLA是现有的检测HLA LOH的技术?
RMP:我们从两方面评估了DASH与现有工具LOHHLA的性能比较。首先,我们在用患者特异性数字PCR分析的患者肿瘤上显示了非常相似的表现。其次,我们用在网上细胞系稀释。虽然这两种方法在所有稀释剂中都有很强的特异性,但我们发现DASH对低纯度的肿瘤和亚克隆事件更敏感。在这两种情况下捕捉HLA LOH对于真实的患者样本至关重要。
斯蒂芬尼:你想强调的新技术有什么局限性吗?
RMP:有几个潜在的改进领域。
首先,机器学习方法高度依赖于训练数据集。将训练数据集扩展到更多的患者,并优化样本标记方法,可以提高模型的准确性。
其次,定量免疫肽组学的结果大多为阴性。可能需要另一项研究来了解根本原因。
第三,DASH专注于LOH。然而,其他一些等位基因失衡机制,如表达失衡,可能与免疫逃逸非常相关。未来的工作可以扩大范围,以检测其他机制的畸变。
西南:你打算如何继续应用这个技术?DASH在未来可以用来为患者量身定制治疗方案吗?
RMP:虽然我们相信HLA LOH可以单独作为生物标志物,但我们最兴奋的是将其与ImmunoID NeXT平台的其他读数集成到复合生物标志物中。我们最近在临床癌症研究描述了DASH在新抗原预测之上的分层,在一种叫做氯丁橡胶™。我们相信,捕捉肿瘤免疫生物学许多不同方面的复合生物标志物是未来,对临床决策具有最大的潜在影响。
参考:派克RM, Mellacheruvu D, Dea S,等.一种具有亚克隆敏感性的机器学习算法揭示了广泛的泛癌人类白细胞抗原杂合性缺失。Nat Commun.2022; 13(1): 1925。doi:10.1038 / s41467 - 022 - 29203 - w
Rachel Marty Pyke采访了Sarah Whelan,科技网络的科学作家。188金宝搏备用