随着长读测序技术的发展和计算方法的改进,现在小团队的研究人员可以创建参考质量的基因组组合,这将有助于更好地了解人类遗传变异的全谱。
利用来自人类泛基因组参考联盟的测序数据,我们从一个德系犹太人个体和一个波多黎各个体中创建了一个参考质量的组装,两者都比当前的GRCh38参考基因组更接近。为了使基因组发挥有效的参考作用,它还需要被准确地注释。为此,我们开发了Liftoff,这是一个专门为基因注释设计的提升工具。通过Liftoff,我们能够将超过99%的人类蛋白质编码和非编码基因映射到这两个组合上。
- 开发一套多样化的人类参考基因组的重要性
- 利用长读测序数据组装高质量基因组的计算方法
- 将注释映射到新的参考基因组的计算方法