PacBio公布了一种全面的全基因组串联重复分析的新方法
PacBio(纳斯达克代码:PACB)宣布了一种新的计算分析方法的可用性,该方法使用PacBio的本地长读HiFi测序数据,对人类基因组中超过100万个串联重复序列(TRs)进行分析。串联重复基因分型工具(TRGT:发音为“target”)旨在为科学家提供获得TRs全基因组序列和甲基化状态的完整特征的能力。
串联重复序列是连续重复的基因序列,它们可以从父母到孩子的长度增长。重要的是,TRs与许多神经系统疾病有关,如ALS和亨廷顿舞蹈症,以及遗传性智力障碍的头号原因脆性X染色体综合征。
PacBio计算生物学副总裁Michael Eberle说:“我们开发TRGT来描述最困难的变体类之一的遗传和表观遗传变异,串联重复。”“到目前为止,由于短读测序技术对这些基因组区域的测序能力的限制,串联重复序列一直没有得到充分的研究。通过结合HiFi测序和TRGT,我们打算为科学家提供探索和表征这些复杂基因组区域的能力,并最终更好地了解它们的生物学影响。”
TRGT旨在使研究科学家能够描述序列组成和结构,重复单位长度,以及每个分析的重复等位基因和基因组侧翼序列的CpG甲基化。TR变异特征的改进可能有助于疾病致病位点的三级分析。例如,TRGT可以描述与某些疾病相关的非常长的(数千个碱基对)重复序列。TRGT还可以识别与小脑性共济失调伴神经病和双侧前庭反射综合征(CANVAS)等疾病的致病性扩张潜在相关的序列组成变化。此外,由于HiFi读取可以识别CpG甲基化,TRGT可以识别与肌强直性营养不良扩张观察到的高甲基化信号。
迈阿密大学米勒医学院教授兼首席基因组学官Stephan Zuchner医学博士说:“TRGT方法是重复扩展分析的重大改进,正在帮助我们发现遗传性疾病个体样本中可能与疾病相关的新的和潜在的重要变异。”Zuchner博士和他的同事Matt Danzi博士,科学家和生物信息学家,专注于研究健康和罕见疾病队列中重复扩张的特征。
为了提高可用性,TRGT还附带了一个配套工具TRVZ,用于可视化每个重复等位基因和分析的侧翼序列的读堆和甲基化数据。
TRGT和TRVZ现在可以在GitHub上使用:https://github.com/pacificBiosciences/trgt/