管理整个人类基因组的需要两个人类最好的和人工智能
T本文是一篇观点文章写的马克·j·基尔。在这篇文章中表达的观点和意见的作者,不一定反映技术网络的官方立场。188金宝搏备用
最近出版的无间隙的,telomere-to-telomere人类基因组组装作为一个真正的提醒重要的工作仍然要完成的基因组初稿到最终装配序列。同样地,虽然我们了解人类疾病致病基因变异在过去的许多年,仍然有很多工作完成这方面的知识,并把它付诸实践。
充分实现精密医学的承诺,我的论点是,我们必须pre-curate每一个变体在人类基因组中。这不是可伸缩的分析师在临床实践中花90分钟变体分子实验室测试的结果报告。Pre-curation最大限度地将这种分析高效和可再生的。
一个很好的例子,pre-curation将是有益的新生儿筛查是下一代测序。这种新方法的筛选要求大量的信息大量的疾病,确保最大限度的诊断结果的准确性。然而,实时评估每个病人的信息和每一个变体将挑战这一行动的可伸缩性。
传统方法变异帘是非常艰苦的,缓慢的,不完整的和容易出错的那样依赖的手动搜索在科学和临床文献的证据。这些手册过程往往错过关键数据,导致不准确的结论关于病人的临床意义的变体。总的来说,所有这一切以前的工作导致的pre-curation人类遗传变异的一小部分。此外,这些老pre-curations往往不足,每天都需要创建新的知识不断更新现有的内容管理,确保没有遗漏。如果我们继续依赖过时的技术,它将不可能完全在我们的有生之年,牧师人类基因组。
更快、更全面的变体帘需要组合方法合并可伸缩性和艾城的敏感性、特异性和准确性,只能来自经验的专家判断人类的策展人。AI-driven科学和临床文献的索引可以确保更完整的信息对于每一个变体,而AI-informed专家管理提供最大特异性结果最大限度地有效的方式。
实现准确和全面的变异的主要瓶颈管理是需要手动定位,评估、注释和文档来自科学和临床文献的证据。特别是,遗传密码的细微差别和基因命名法的特性和其他生物的复杂性很难消除歧义的术语,并确保管理是正确和完整的。
人工智能是一个自然的解决这些挑战。只计算方法能够满足这种雄心勃勃的全基因组变异的规模和灵敏度要求管理。有先例使用人工智能海量数据索引——通常非结构化和缺乏有组织的数据,所以它是一个很好的适合科学和临床文献索引。关注和解决遗传歧义和专注于最关键的临床信息是至关重要的。
一个训练有素的专家团队必须仔细评估证据和组装做出明智的判断其合理性和适用性,以及确保最大精度的最终解释。这个审查过程可以进一步加速了AI-driven组织和注释的数据。
这种方法已经使对致病变异的病人提供新的见解。在一个例子中,罕见的基因组学研究所的科学家们重新分析之前使用一个AI-powered工具和不确定的外显子组结果发现一个科学报告允许他们一个关键变量进行分类的致病性和产生一个以证据为基础的诊断和有效治疗的病人。
与人工智能技术,提供的速度和规模可能将在未来几年来建立整个人类基因组。用组合方法,汇集了最好的自动化人工智能和专家管理,我们可以坚定地建立基因组情报的基础需要精密医学所有病人的现实。
关于作者:
马克·基尔首席科学官Genomenon创始人之一,一个AI基因组学公司。他有着丰富的经验在基因组测序和临床资料分析。马克是一个分子遗传病理学家收到他的MD /干细胞生物学博士学位,从密歇根大学癌症基因组学。