我们已经更新我们的隐私政策使它更加清晰我们如何使用您的个人资料。

我们使用cookie来提供更好的体验。你可以阅读我们的饼干的政策在这里。

广告

设计新算法对大规模基因组分析

设计新算法对大规模基因组分析内容块的形象
信贷:iStock

想要一个免费的PDF版本的这个新闻吗?

完成下面的表格,我们将电子邮件您的PDF版本“一个新的算法用于大规模基因组分析”

听与
喋喋不休地说
0:00
注册免费听这篇文章
谢谢你!听这篇文章使用上面的球员。
阅读时间:

单是一组基因变异,并排放置在同一染色体上,在一个传输给下一代。他们的考试可以理解某些复杂的遗传特征,如患疾病的风险。然而,进行这种分析,基因组分析的家庭成员(父母和他们的孩子)通常是必要的,一个繁琐和昂贵的过程。

为了解决这个问题,研究人员从日内瓦大学的(UNIGE)和洛桑(UNIL)和瑞士生物信息学研究所开发了SHAPEIT4 SIB,一个强大的计算机算法,允许成千上万的单体型无关的个人很快被识别。结果详细当家庭执行分析,这一过程无法进行如此大的规模。他们的工具是现在网上下一个开放源码许可,免费提供给整个科研界。

如今,基因数据的分析变得越来越重要,特别是在个性化医疗领域。人类基因组测序的数量每年增长指数和最大的数据库账户超过一百万人。这个数据是极其宝贵的财富更好地了解人类遗传的命运,是否确定基因体重在一个特定的疾病或更好地理解人类迁徙的历史。是有意义的,然而,这些大数据必须以电子方式处理。

“计算机的处理能力仍相对稳定,与基因组的超高速增长大数据”,说奥利维尔·Delaneau SNSF UNIL计算生物学的教授生物学和医学学院在SIB,导致这项工作。“我们的算法从而旨在优化处理基因数据为了吸收如此大量的信息,使其可用的科学家,尽管其数量和相对有限的实力差距的电脑。”

更好地理解单体型的作用

基因分析可以知道一个人的等位基因,即基因变异收到他或她的父母。然而,不知道父母的基因组,我们不知道哪些等位基因同时传播给孩子,而组合。”这条信息——单是至关重要的,如果我们真的想理解人类变异的遗传基础,”解释Emmanouil Dermitzakis,遗传医学系教授和发展UNIGE医学院和SIB co-supervised这项工作。“这是真正的为群体遗传学或精密医学的角度。”

确定遗传疾病的风险,例如,科学家评估遗传变异是否或多或少存在于个体发展疾病为了确定这种变化疾病的作用进行了研究。“通过了解单,我们进行相同类型的分析,Dermitzakis说。然而,我们正从一个变体的组合很多变体,它允许我们确定哪些等位基因组合在同一个染色体疾病风险有最大的影响。更准确得多!”

方法由研究人员可以开发过程极其大量的基因组,大约500000到1000000人,并确定他们的单不知道他们的祖先或后代,而使用标准的计算能力。SHAPEIT4工具已成功测试在500000个人基因组出现在英国生物库,一个科学数据库开发的联合王国。“我们这里有一个典型的例子,大数据是什么,Delaneau说。这样的大量数据可以建立高精度的统计模型,只要他们可以解释没有溺水。”

透明的开放源码许可

研究人员已经决定让他们的工具可以访问所有在一个开源的MIT许可:整个是可用的,并且可以修改代码,根据研究者的需要。这个决定主要是为了透明度和再现性,以及刺激研究人员来自世界各地。“但是我们只给访问分析工具,语料库的数据在任何情况下,“Delaneau解释道。“然后每个使用它的数据他或她。”

比旧的工具,这个工具更有效更快、更便宜。它还可以限制数字环境的影响。非常强大的计算机用于处理大数据确实非常密集;减少使用还有助于减少他们的负面影响。

参考

Delaneau。(2019)准确、可伸缩的和综合单体型评估。自然通讯。DOI: https://doi.org/10.1038/s41467 - 019 - 13225 - y

本文从以下转载材料。注:材料可能是长度和内容的编辑。为进一步的信息,请联系引用源。

广告
Baidu