PacBio揭示新方法全面、全基因组串联重复序列分析
PacBio(纳斯达克:PACB),宣布了一个新的计算的可用性分析方法分析一百万多个串联重复序列在人类基因组(TRs)使用PacBio本地读HiFi测序数据。串联重复序列的基因工具(TRGT:明显的“目标”)的目的是为科学家提供序列的获得一个完整的描述能力和TRs全基因组甲基化状态。
串联重复序列是串联重复的基因序列,他们可以从父母到孩子长高。重要的是,TRs与许多神经系统疾病如ALS和亨廷顿氏舞蹈症除了继承了精神智力障碍的一个原因,脆性X综合征。
“我们发达TRGT描述遗传和表观遗传变异的一个最困难的变体类,串联重复序列”Michael Eberle说PacBio计算生物学的副总裁。“到目前为止,串联重复序列替代由于短内容的能力限制这些区域的基因组序列测序技术。通过结合HiFi测序和TRGT,我们打算为科学家提供探索的能力和描述这些复杂的基因组区域,最终,更好地理解他们的生物影响。”
TRGT旨在使研究科学家描述序列组成和结构、重复单位长度,CpG甲基化对于每个重复等位基因和旁侧序列在基因组分析。TR变异的改进特征可能有助于高等分析疾病导致位点。例如,TRGT可以描述很长(成千上万的碱基对)重复与某些疾病有关。TRGT还可以识别序列组成变化,可能与致病性有关扩张在小脑性共济失调等疾病与神经病变和双边前庭反射消失综合症(帆布)。此外,由于高品质阅读可以识别CpG甲基化,TRGT可以识别信号像观察甲基化与肌强直性营养不良扩张。
“TRGT重复扩展分析方法是一个重大的改进,帮助我们发现新的和潜在的重要的变异可能与疾病相关的样本个体与遗传疾病,”斯蒂芬Zuchner说,医学博士,博士,教授,米勒医学院的首席基因组学官,迈阿密大学。Matt Danzi Zuchner博士和他的同事,博士,科学家和bioinformatician,重点是表征的研究在健康和罕见的疾病人群重复扩张。
提高可用性,TRGT还带有一个同伴工具,TRVZ,可视化读限速和甲基化数据为每个重复等位基因和旁侧序列分析。
TRGT和TRVZ现在可以在GitHub:https://github.com/pacificBiosciences/trgt/