全外显子组测序在个性化医疗的曙光
破译人类基因组的第一个完整序列2003年需要来自20个机构还有30亿美元的资金。在过去的十年中,全外显子组测序(WES)成为一种成功平衡成本和用于诊断或研究应用的有用数据输出的方法。在这里,我们看看WES是如何在实验室和临床中使用的,以及为什么它是这些领域的首选方法。
WES的核心技术
基因组DNA的下一代测序(NGS)有两种主要方式:全基因组测序(WGS)和WES。“从本质上讲,WGS和WES都依赖于相同的技术:通过将基因组DNA的长片段分割而产生的数百万到数十亿个短DNA片段的大规模并行测序,”来自麻省理工学院的癌症研究员Marco Magistri博士说西尔维斯特综合癌症中心在迈阿密大学。然而,WGS的目标是测序整个基因组,WES涉及一个额外的步骤,从基因组中选择DNA片段其实基因组的区域。
只有1%到2%的人类基因组编码基因。其余的基因组大部分还未被探索,不过多亏了最近的研究越来越多的“暗物质”DNA被映射到调控元件上,比如增强剂1而且绝缘体2.在医学上,WGS提供了识别潜在致病变异的能力,不仅在基因中,而且在调控元件中。
然而,从字面上看,WGS的这个特性是有代价的:与WGS相关的测序成本是很高的是WES的3 - 4倍3..此外,引起疾病的DNA变异倾向于聚集在常见疾病的基因编码区域内和周围,如自闭症4而且癌症5.因此,当需要分析大量患者样本时,WES是常用的方法。
数据分析瓶颈
测序机的输出是一个非常大的文本文件,包含数百万个被称为reads的字符串,四个DNA碱基As, Ts, Gs和C的序列。
一个典型的WGS或WES实验需要对基因组的每个区域进行50-100次测序(准确的数字称为“覆盖率”);否则,就不可能将PCR扩增引入的错误DNA碱基(或测序机误读)与患者DNA序列的真实变化区分开。在WES和WGS中,完整的数据分析过程对计算的要求都很高,通常需要具有大量磁盘空间、内存和并行化能力的专用高性能计算系统。即使在这样的系统上,分析一个WES实验也需要几个小时的计算时间。“在相同的覆盖范围内,WGS实验产生的原始数据是WES实验的50倍,因此在计算能力和数据分析时间方面,WGS实验的要求明显更高,”评论道Yonatan佩雷斯他是加州大学旧金山分校的博士后。
WES如何应用于现代生物医学研究
相对低廉的价格和覆盖基因组中所有(注释)基因的组合使WES成为现代生物医学研究的“工作马”,提供了相对便宜的个人DNA压缩分析。最近一项研究分析了35584个自闭症患者的完整外显子6并确定了99个与该疾病相关的高可信度风险基因。这项研究代表了迄今为止最大的自闭症患者全外显子组队列,并扩展了具有新候选基因的高置信风险基因目录,例如DEAF1,KCNQ3而且SCN1A.
越来越多的基因组DNA分析,包括WES,不仅作为一种独立的技术使用,而且与RNA测序等技术结合使用;允许鉴定基因的DNA序列变异对其表达水平的影响。最近正在进行的一项研究将WES与单细胞RNA测序7(scRNA-seq),一种识别复杂组织中特定细胞类型的基因表达变化的技术。Perez说:“对于我们的目的来说,使用WES非常有意义,因为我们的重点是应用scRNA-seq方法来研究精神疾病中特定细胞类型的变化。”Perez是将WES与患者死后脑组织样本的单细胞RNA测序结合起来的研究团队的一员。
由于对于大多数调控基因间区域,如增强子,目标基因的身份是未知的,并且可能根据细胞类型而改变,因此WES数据通常更容易与特定RNA和蛋白质的表达联系起来。Perez评论说:“我们选择WES是因为我们的目标是根据单细胞RNA-seq分析,看看患者脑组织中的基因失调是否与潜在的致病性变异有关。”
WES是首选的诊断工具
直到最近,对包括遗传成分的疾病的DNA检测只使用针对单个基因或一组基因(通常称为基因组)的靶向检测。其中包括检测与肿瘤亚型相关的已知预测基因突变,以及基因定义的神经退行性疾病,如额颞叶痴呆亚型和早发性阿尔茨海默病。例如,突变乳腺癌易感基因1或BRCA2乳腺癌的风险因素是否已经确定,携带这些突变的女性是否已经被发现55- 85%的终生乳腺癌风险和预防性乳房切除术的益处8.然而,当疾病的遗传原因未知,但患者的临床表现表明患有孟德尔疾病时,WES推荐自己为致病基因发现的理想工具9.此外,最常见的癌症和神经系统疾病在基因上过于异质,无法通过对单个基因甚至一组基因的检测来覆盖。
“在我们实验室的一个项目中,我们正在研究一种以前没有特征的淋巴瘤,”Magistri说。“由于我们不知道这种癌症亚型的体细胞突变情况,我们正在使用WES来获得这些肿瘤中遗传变异的无偏倚和全面的读数。”
在一个相对较新的精确肿瘤学领域,WES结合其他无偏倚技术是综合分子诊断的首选方法。例如,经WES鉴定的迂腐性实体瘤的体细胞突变对40%的患者得到诊断和治疗10.重要的是,这些突变大多被传统的靶向检测遗漏了。因此,对于多种诊断应用来说,WES是一种经济和全面的选择。
个性化医疗时代WES的未来
WGS已被提出提供了许多优于WES的优势,包括检测非编码致病变异和提供诊断率提高11.“WGS是一种更全面的方法,但比WES更昂贵。随着我们对基因组调控元件了解得更多,测序成本下降,使用WGS将变得更有吸引力,”Perez说。
“然而,对于涉及大型患者队列和医疗保健的研究,WES仍将是一个有价值的工具,因为它降低了价格和简化了分析。”NGS技术直到最近才开始与医疗保健领域的靶向基因检测竞争和补充,直到测序成本下降,可以进行常规的WGS检测,WES才能在价格和诊断价值之间实现完美平衡。
引用:
1.Shlyueva, D., Stampfel, G. & Stark, A.转录增强子:从特性到全基因组预测。自然评论遗传学15,272,doi:10.1038/nrg3682(2014)。
2.West, a.g., Gaszner, M. & Felsenfeld, G.绝缘子:多种功能,多种机制。基因工程学报(自然科学版),21 (4):374 - 374(2002)。
3.施瓦茨,K.,布坎南,J.,泰勒,J. C.和华兹华斯,S.全外显子组和全基因组测序方法是否具有成本效益?系统的文献综述。医学遗传学20,1122-1130,doi:10.1038/ gimm .2017.247(2018)。
4.一个,J.-Y。et al。全基因组从头风险评分提示自闭症谱系障碍启动子变异。《科学》362,doi:10.1126/ Science。aat6576(2018)。
5.nick - zainal, S.等人。560个乳腺癌全基因组序列的体细胞突变景观。自然学报(自然科学版),2016,34 - 34,doi:10.1038/nature17676(2016)。
6.Satterstrom, f.k.等人。自闭症的新基因涉及兴奋性和抑制性细胞系的风险。中国生物医学工程,2018,doi:10.1101/484113(2018)。
7.Shapiro, E. Biezuner, T. & Linnarsson, S.基于单细胞测序的技术将彻底改变整个生物科学。自然评论遗传学14,618,doi:10.1038/nrg3542(2013)。
8.Meijers-Heijboer, H.等人。BRCA1或BRCA2突变女性预防性双侧乳房切除术后的乳腺癌新英格兰医学杂志345,159-164,doi:10.1056/NEJM200107193450301(2001)。
9.吴,S. B.等。外显子组测序确定孟德尔疾病的原因。中国科学院学报:自然科学版(2010)。
10.帕森斯,d.w.等。实体瘤儿童临床肿瘤诊断率和生殖系全外显子组测序实体瘤儿童遗传测序诊断率实体瘤儿童遗传测序诊断率美国医学会肿瘤学杂志2,616-624,doi:10.1001/ JAMA Oncology .2015.5699(2016)。
11.Rusch等人。全基因组、外显子组和转录组三平台测序的临床癌症基因组分析。自然科学进展9,339,doi:10.1038/s41467-018-06485-7(2018)。