波场TRON的CoVigator提供了一个看不见的SARS-CoV-2视角
SARS-CoV-2变体Delta和Delta-plus正在世界各地传播,但这只是德国美因茨研究机构TRON记录的数百种独特突变中的两种。利用他们公开提供的CoVigator网络研究工具,研究人员和科学家可以浏览TRON的广泛数据库,该数据库使用数千名COVID-19患者的基因序列跟踪病毒的生物地理进化。
特隆gGmbH是一个非营利性的研究机构,成立为独立的大学医学中心美因茨约翰内斯古登堡大学(德国)。TRON,意为“转化肿瘤学”,是科学研究和药物应用之间的桥梁,通过新颖的研究发现免疫系统的免疫机制和治疗调节。他们的研究主要针对癌症,但随着2020年大流行的发展,他们运用自己的工具和专业知识编制了一个SARS-CoV-2突变的活数据库。
波场TRON生物标志物开发中心(BDC)副主任Martin Löwer解释说:“疫苗旨在触发人类免疫系统识别入侵的病毒或细菌,并像往常一样消灭它。”“但要开发疫苗,需要了解病毒或细菌是如何侵入人体细胞的,以及如何对它们进行修饰。我们分析基因组以寻找DNA中的特定突变,这对于了解疾病的进化以及个性化药物如何影响不同患者的疾病非常重要。”
整个2020年,随着COVID-19发展成为全球大流行,全球数百万人被感染,这些不同的人群提供了SARS-CoV-2病毒可以通过突变进化的宿主。卫生专业人员和科学家对突变变体非常感兴趣,因为疫苗正在开发以对抗疾病的传播。随着SARS-CoV-2的Delta变种感染已接种疫苗的个体,并在未接种疫苗的人群中猛烈传播,我们看到了突变的危险影响。
虽然2020年的几项研究已经报告了不同的菌株和突变率的增加,但TRON的科学家们对进化如何影响疫苗的有效性感兴趣。因此,他们开始分析SARS-CoV-2病毒的刺突糖蛋白(刺突蛋白),这是它用来入侵人类宿主细胞的特征。批准使用的mRNA疫苗旨在诱导针对刺突蛋白的免疫反应。
波场TRON的生物信息学科学家托马斯·布库尔(Thomas Bukur)说:“当我们开始研究时,这种病毒的基因组信息很少。”“但我们很快意识到,这种病毒有变异和进化的潜力。我们还意识到,越来越多的国家开始了大规模的测序计划。我们希望收集所有这些病毒信息,并了解不同人群和地理区域随时间的变化。”
测序计划创建了大量不同的病毒DNA序列读取库。这些序列继续导致病毒变体的发现,如Delta,但当时没有关于刺突蛋白在地理位置和个体间进化的数据库。波场TRON使用这些存储库开始寻找刺突蛋白的变体。
CoVigator截图。信贷:特隆
发现突变需要超级计算能力
在基因组中寻找变异是一个复杂的过程,需要强大的计算机进行大量计算。一个完整的基因组是从下一代测序机(NGS)中对碱基对序列的短片段进行比对。SARS-CoV-2 DNA由3万个碱基对组成(而人类基因组有32亿个碱基对)。基因组存储库提供了病毒的全基因组集合和必须首先对齐的序列数据集,就像从一个30,000块拼图中拼合碎片一样。一旦对齐,波场TRON的分析将查看原始的“野生型”参考基因组和正在研究的样本之间的具体差异。这些差异被注释为变体(突变),从数十万个样本中,可以加起来有数百万个变体。
为了识别刺突蛋白中的非同义突变,TRON科学家建立了一个利用各种基因组处理和生物信息学工具的计算管道。 这 冠状病毒导航器(CoVigator)总会在 管道包括修剪,对齐,变量调用和其他任务使用 来自许多基因组软件库的开源工具,包括广义基因组分析工具包(GATK),BCFtools,LoFreq和iVar. 他们的CoVigator NGS管道在Nextflow框架中实现,并在GitHub供其他研究人员使用。
波场TRON的主要工作集中在癌症和其他高医疗需求的疾病。将现有的计算资源分配给SARS-CoV-2分析可能会推迟其他重要的发现。处理primeLine解决方案和英特尔流行病应对技术计划波场TRON收购了10个基于第二代英特尔至强可扩展处理器的英特尔服务器系统新节点。新系统为TRON 960提供了专用线程,以并行方式运行数千个任务以供分析。 波场TRON现在能够在不到3小时的时间内分析和处理超过2万组测序数据集,为不断增长的公开数据集提供近乎实时的分析。
CoVigator提供了研究SARS-CoV-2的新视角
波场TRON的初步研究,产生了一个预印,使用了来自GISAID、NCBI病毒和NCBI SRA档案的146917个全基因组组装和2393个下一代测序(NGS)数据集。该研究显示,一小部分样本中含有没有变化的野生型刺突蛋白,但在所有样本中发现了2592个不同的变体。突变率很低,但随着时间的推移而增加。此外,波场TRON发现了亚克隆突变,表明可能与各种SARS-CoV-2毒株合并感染和/或病毒在宿主内进化,以及可能影响抗体结合或t细胞识别的变体。
“这项研究中最有趣的发现,”Löwer评论道,“是看到了刺突蛋白的许多变体。其次,能够回顾过去一年半,并准确追踪它是如何演变的,这提供了一个新的视角。我们能够在其发展的早期发现哪怕是很小的变化。我们可以看到它是如何从一个病人身上开始,然后在病人体内变异成几个变种,并跨越人群和地理区域。由于病毒继续在世界各地传播,我们看到突变是如何随着时间的推移在全球范围内传播的。”
较低的 指出,虽然他们没有首先对其进行测序,但B.1.1.7(英国)谱系的特点是积累了17个变体——其中8个位于刺突蛋白中。 考虑到新发现的变种,包括最新的Delta和Delta-plus变种,继续监测和编目sars - cov -2的演变以及变种对疫苗的影响非常重要。
“我们现在知道,免疫系统不能识别整个刺突蛋白,”他补充说 低。 “它能识别蛋白质的特定小部分,我们称之为表位。人们已经研究了疫苗如何触发免疫系统来识别这些表位。我们想继续研究我们发现的突变是否会改变免疫系统检测到的表位。这是疫苗生产商和科学家想知道的。”
未来大流行的工具
波场TRON的工作让我们对SARS-CoV-2病毒有了新的认识 但这项研究仅仅是努力的开始,首先要了解,然后帮助科学家持续监测和分析病毒的进化。T Heir的新工作将大量的数据组合成一个单一的资源,使科学家不仅能够查看许多低频变体,而且能够在多个主机上并行查看相同的变体,在一个数据库中一起呈现许多不同的维度。
Bukur说:“如果没有新的计算资源,我们只能完成最初的研究。”“有了新系统,我们能够提供正在进行的研究,从数百万个样本中下载数据,并并行处理它们,以确定刺突蛋白变体。一旦我们得到结果,我们就会将它们发布到我们的CoVigator web服务仪表板上。有了这个平台,我们能够继续工作,并将最新的数据提供给研究界。”
了解新病毒和已知病毒的突变对于解决和持续管理广泛和危险疾病的治疗反应至关重要。肯定还会有其他独特的流行病。而且,随着气候变化,科学家们正在观察现有危险的热带疾病从赤道地区转移到更温和的地区。这些威胁将给医疗保健带来新的挑战。TRON科学家创建的工作流程和管道可以快速适应新的病毒和病毒株,为协同免疫生物学研究和响应提供新的工具。
“在某种程度上,我们可以在测序过程中检测到这些变异,”总结道 低, 并能够在单个患者身上看到那些个体突变,这些突变在几个月后会形成更危险的变异,比如Delta。但是很早就看到这些非常小的变化,并判断它是数据的变体还是随机波动,这意味着我们非常接近噪声水平。但我们知道我们可以具体,因为我们现在知道关键变异发生在哪里。这不会是最后一次大流行。我们希望利用我们所学到的知识来开发早期检测后续病毒及其突变的方法。”
了解更多TRON CoVigator NGS管道的消息。