使用机器学习来提高癌症生物标记物的免疫疗法
肿瘤细胞的避免破坏免疫系统的能力是核心之一癌症的标志。免疫系统旨在识别和消除恶性细胞也承认“异己分子”表示肿瘤neoantigens由人类白细胞抗原(HLA)表面的细胞。
HLA的杂合性(HLA-LOH)是一种现象,发生在一些癌症细胞,帮助他们逃避免疫系统的检测。HLA等位基因编码的抗原呈递机械删除这些细胞的基因组,有效地隐藏他们的免疫系统的检测。成功的免疫疗法等免疫抑制剂检查站,理解在癌症免疫逃避比以往任何时候都更重要。然而,尽管HLA-LOH识别的重要性在预测应对免疫疗法,目前很少有精确的方法对其检测。
生物科技公司Personalis最近的一篇论文发表在自然通讯详细介绍一种新的机器学习算法能够检测HLA LOH从whole-exome测序数据。这一新的机器学习方法——名为破折号(删除Allele-Specific HLA)——检测HLA LOH使用配对正常和肿瘤组织的数据,目的是推进使用HLA-LOH癌症免疫疗法的生物标志物。
找到更多关于破折号及其应用,我们采访了雷切尔·马蒂·派克博士生物信息学经理科学Personalis和论文的主要作者。
莎拉·惠兰(SW):你解释,HLA LOH是重要的肿瘤细胞逃避免疫识别——如何重要的是肿瘤免疫逃逸,以及它是如何影响免疫疗法的潜在用途吗?
雷切尔·马蒂·派克(RMP)博士:肿瘤的证据immunoediting一直建立在过去的半个世纪中,导致的“逃避免疫破坏”的“癌症”的标志。Immunoediting是免疫细胞攻击并杀死癌症免疫原性克隆,留下更少的免疫原性,或隐藏,克隆在生存和成长。这里有几个突出的文学:
- Chowell等人发表了两篇论文(科学2017年和自然医学2019年)显示,减少生殖系的HLA基因代码的变化主要组织相容性复合物(一起)导致反应降低检查点封锁免疫疗法,这表明缺乏多样性neoantigens可以促进对病人免疫逃逸,导致贫困的效果。
- 在过去的一个月,两个辉煌自然论文量化immunoediting显示热点突变之间的最优平衡致肿瘤性和免疫原性(好不et al。和Luksza et al。)。
文献表明,肿瘤免疫逃逸的形状演化的必要性及影响患者预后——两个关键领域!
免疫疗法的敏化或re-sensitizing肿瘤病人的免疫系统,让它攻击并杀死肿瘤。免疫逃避可以干扰这个过程体现在几个方面:
- 减少肿瘤的免疫原性neoantigens可能导致更少的目标免疫系统,降低检查点抑制剂有效。
- 打破的抗原表达机械(如HLA)可以阻止全部或特定抗原的演讲使检查点疗法,个性化的癌症疫苗和收养T细胞疗法都有效。
- 肿瘤通常由t细胞移植检查站阻止攻击。个性化的癌症疫苗不能独自克服这种免疫逃避的方法,迫使联合疗法的兴起与检查点抑制剂。
西南:你能简要介绍这种新开发的技术——破折号——是如何工作的?
RMP:DASH依靠输入的高质量的外显子组测序从病人肿瘤和正常的DNA。而我们设计的方法与HLA-enriched工作ImmunoID下®平台,我们还证明了方法还适用于其他外显,轻微的性能降低。从外显子组测序数据,执行HLA打字,肿瘤和正常读取对齐到一个特定的HLA参考。然后,七个特征计算和使用作为一个输入XGBoost机器学习模型,检测HLA在特定基因LOH。
模型的性能取决于它的特性的模型。我们致力于量化的独特方面HLA区域区分从基因组的其他部分。我们的两个独特的特性是:
- 修改b频率。b通常是指非引用两个等位基因的等位基因A和b - b频率是指强度比率两个等位基因微阵列。在我们的例子中,我们使用它来参考序列深比之间的两个等位基因。大多数拷贝数检测算法使用b等位基因频率理解如果有不平衡。然而,由于复杂的HLA区域,调查质量的捕获特定的等位基因可以改变。要克服这个障碍,我们正常的b频率正常DNA占这些探针偏见。
- 侧翼地区。HLA基因相对较短,有时有几个基因组同源等位基因之间的区别。增加我们的敏感性和信心在我们的电话,我们利用来自周围地区HLA基因的信息。
西南:这是你的主要目的是开发新技术?
RMP:我们有两个主要的焦点。首先,我们想调整方法专门为HLA区域,所以我们专注于设计功能,捕获的独特挑战HLA区域(如上所述)。第二,我们想开发正交方法真正理解该方法的性能。
西南:你的经验在开发这个新技术的挑战吗?
RMP:大多数我们所面临的挑战在这个项目中围绕着验证。我们花了三个主要的验证方法在网上细胞系稀释,针对病人的数字聚合酶链反应(PCR)和功能性immunopeptidomics。
执行在网上细胞系稀释量化检测极限的方法,我们必须配置文件几十个细胞系找到HLA的LOH。由于HLA基因的复杂性和多样性,我们必须设计allele-specific病患专用的评价删除与数字PCR引物。我们经历了若干次迭代寻找最优引物为每一个病人,一个干净的信号。最后,我们发现,定量immunopeptidomics方法验证是非常具有挑战性的。当我们希望显示健壮的验证结果在本节中,我们找到了一个有限的信号的方法。我们假设几个原因找到,但它可能会真正理解的另一个研究论文局限性是否技术或生物。
西南:破折号如何比较LOHHLA(人类白细胞抗原杂合性丢失),现有的技术检测HLA LOH吗?
RMP:我们评估的性能相比,现有的工具,LOHHLA在两个方面。首先,我们展示了非常相似的组患者的肿瘤表现我们与特定的数字PCR异形。第二,我们评估了表演使用在网上细胞系稀释。所有稀释,而这两种方法都具有很强的特异性,我们发现短跑是更敏感的肿瘤较低纯度和sub-clonal事件。两种场景中捕捉HLA LOH真实的患者样本是至关重要的。
西南:有没有你想强调的新技术的局限性?
RMP:有几个潜在的需要改进的地方。
首先,机器学习方法是高度依赖于训练数据集。扩大更多的病人和优化方法的训练数据集标签样品可以提高模型的准确性。
其次,定量immunopeptidomics方法产生了否定的结果。另一项研究可能需要了解问题的根源。
第三,破折号专门着重于LOH。然而,一些其他等位基因不平衡机制,如表达失衡,可能非常相关的免疫逃逸。未来的工作范围可以扩大在其他机制来检测畸变。
西南:你打算如何应用这种技术前进?短跑可以用来调整治疗方案的病人在未来?
RMP:虽然我们相信HLA LOH可以作为生物标志物,我们最兴奋的整合与其他读数ImmunoID下平台为复合生物标志物。我们最近发表了一篇论文临床癌症研究上面描述的分层DASH neoantigen预测的生物标志物氯丁橡胶™。我们相信复合生物标记捕获肿瘤免疫生物学的许多不同方面的未来和最高对临床决策的潜在影响。
参考:RM·派克,Mellacheruvu D, Dea年代,等。机器学习算法与subclonal敏感性揭示普遍的人类白细胞抗原pan-cancer杂合性丢失。Nat Commun。2022;13 (1):1925。doi:10.1038 / s41467 - 022 - 29203 - w
雷切尔·马蒂·派克说莎拉·惠兰,科学技术网络作家。188金宝搏备用