利用机器学习创造更好的基因疗法
腺相关病毒(Adeno-associated viruses, aav)由于其非致病性,可以将治疗性DNA转移到靶细胞中,已成为向人体缺陷组织传递基因疗法的有前途的载体。然而,虽然美国联邦药物管理局(FDA)批准的第一批使用AAV载体的基因治疗产品和其他产品可能会跟进,但AAV载体仍然没有充分发挥其潜力来应对基因治疗的挑战。
首先,目前使用的AAV衣壳——包裹着病毒单链DNA基因组的球形蛋白质结构,可以被修改为编码治疗基因——在特定的受疾病影响的组织上的能力有限,而且它们在整个人体的广泛分布导致它们被稀释。其次,患者的免疫系统在暴露于类似的AAV病毒后,可以产生中和抗体,即使是低水平的抗体,也可以在再次暴露时破坏AAV(中和),阻止其治疗性DNA有效载荷的传递。
为了克服这种中和问题,研究人员正在设计增强的AAV衣壳,他们希望能够逃避免疫系统。目前使用的方法,包括在实验室条件下快速跟踪蛋白质进化的“定向进化”策略,只能创建有限的衣壳多样性,其中大多数仍然类似于自然发生的AAV变体,即血清型。然而,使用这种方法产生足够的多样性而不失去衣壳的其他期望功能,例如它们的稳定性或与特定细胞类型结合的能力,仍然很困难。
现在,一项由威斯核心教师发起的新研究乔治教会”哈佛大学Wyss生物启发工程研究所的合成生物学团队,在与谷歌Research合作的推动下,应用了计算深度学习方法,从编码免疫识别和目标组织感染的关键蛋白质片段的DNA序列中设计出高度多样化的AAV2血清型衣壳变体。AAV2是研究最多的血清型,已用于FDA批准的首个基因疗法,用于治疗致盲疾病。
该团队从相对较小的衣壳数据收集开始,训练了多种机器学习方法,并使用它们设计了20万个病毒变体。其中110,689个变异产生了活的AAV病毒。在任何两种自然发生的AAV血清型之间,该段内的12个氨基酸预计是不同的。该团队的努力产生了超过57000个变种,它们表现出比这更高的多样性,其中一些含有多达29个组合取代或额外插入的氨基酸。研究结果发表在《自然生物技术》杂志上。
“我们的方法实现了迄今为止所有衣壳库中最高的功能多样性。它打开了功能性但以前无法到达的序列空间的广阔领域,具有许多潜在的应用,用于生成改进的病毒载体,如免疫原性大大降低的aav和大大提高的目标组织选择性,以及高效的基因治疗,”最后一位作者Eric Kelsic博士说,他与Church博士一起启动了该项目,并共同创立了初创公司Dyno Therapeutics,他现在担任首席执行官。Dyno Therapeutics的使命是利用尖端的人工智能(AI)方法开发先进的基因治疗运载工具。
使用多种设计策略,该团队首先生成了更小的数据集,他们可以在这些数据集上训练几个机器学习模型。这些是AAV衣壳的集合,在AAV2 VP3蛋白的28个氨基酸片段中引入了可变数量的突变,形成了衣壳的一部分,并使其暴露于中和抗体。一种高通量的方法可以合成突变衣壳序列,并在体外实验中测试哪种方法可以有效地产生稳定的衣壳,为他们的整体方法提供了一个高效的测试平台。然后,该团队将第一个实验研究的结果用作三个替代机器学习模型的训练数据,这些模型生成了大量不同的衣壳变体,并将在最终的验证实验中进行测试。
创造不同的AAV衣壳和可以逃避中和的变体的一个中心瓶颈是保持稳定的衣壳的生产:大多数变体将无法组装成功能衣壳或包装它们的AAV基因组。“我们与谷歌合作者部署的深度神经网络模型准确预测了极其不同变体的衣壳生存能力。在衣壳部分达到这种多样性水平是一个重要的里程碑,我们可以在此基础上找到用于基因治疗的免疫逃避衣壳,”共同第一作者Sam Sinai博士说,他曾是Church的研究生,在Wyss研究所加入了Kelsic的团队,并且是Dyno Therapeutics机器学习团队的联合创始人。“我们可以采用类似的方法来制造具有更高组织选择性的AAV衣壳。”
2019年,包括凯尔西奇、西奈和他们的导师丘奇在内的Wyss前团队在《科学》杂志上发表了一项相关方法,他们以不同的方式逐个突变整个AAV2衣壳内的735个氨基酸。他们所谓的“广泛”搜索导致了一个巨大的AAV库,确定了影响AAV2生存能力的变化及其对小鼠特定器官的“回巢”潜力,以及一种以前未知的与细胞膜结合的附属蛋白,它隐藏在衣壳编码DNA序列中。在他们之前的研究中,研究人员使用了一个简单的实验模型来优化病毒的组织靶向能力。
“这项涉及谷歌Research开发的机器学习模型的新研究很好地补充了我们早期的工作,因为它专注于AAV衣壳的一个小但非常重要的区域,具有前所未有的分辨率,”共同通讯作者Church说。“这表明,神经网络与我们实验室开发的高通量合成测试相结合,正在改变我们设计基因传递载体和蛋白质药物的方式。”丘奇是该项目启动的维斯研究所合成生物学平台的负责人,也是哈佛医学院遗传学教授、哈佛大学和麻省理工学院健康科学与技术教授。
“这项工作让我们得以一窥未来,因为机器学习等人工智能方法正在开辟广阔的新设计空间,使开发全新的药物和药物输送方法成为可能,以应对人类健康面临的无数挑战。这也突出了Wyss研究所在迫切需要新疗法的领域致力于计算解决问题,”Wyss创始董事Donald Ingber医学博士说,他也是哈佛医学院和波士顿儿童医院的Judah Folkman血管生物学教授,以及SEAS的生物工程教授
参考:布莱恩特DH,巴希尔A,西奈S,等。通过机器学习实现AAV衣壳蛋白的深度多样化。生物科技Nat》.2021.doi: 10.1038 / s41587 - 020 - 00793 - 4.
本文已从以下地方重新发布材料.注:材料的长度和内容可能经过编辑。如需进一步信息,请联系所引用的来源。