我们已经更新了隐私政策为了更清楚地说明我们如何使用您的个人资料。

我们使用cookie为您提供更好的体验。你可参阅我们的饼干的政策在这里。

广告

人工智能工具可以预测DNA结构和调控

预测人类基因组DNA片段的3D结构。来源:德州大学西南大学

想要一个免费的PDF版本的这个新闻故事?

填写下面的表格,我们会将PDF版本的人工智能工具可以预测DNA结构和调控

听与
喋喋不休地说
0:00
免费注册收听这篇文章
谢谢你!用上面的播放器听这篇文章。
阅读时间:

新开发的根据最近的两项研究,人工智能(AI)程序仅根据原始序列就准确地预测了DNA的调节元件和三维结构的作用自然遗传学。研究作者说,这些工具最终可以揭示基因突变如何导致疾病,并可能导致对基因序列如何影响细胞核中染色体DNA的空间组织和功能的新理解周健博士,副教授Lyda Hill生物信息学部门在UTSW。


“总的来说,这两个项目提供了一个更完整的图景,说明DNA序列的变化,甚至是非编码区域的变化,是如何对其空间组织和功能产生巨大影响的,”该研究中心的成员周博士说哈罗德c西蒙斯综合癌症中心卢佩·默奇森基金会医学研究学者,德克萨斯州癌症预防与研究所(CPRIT)学者。


只有大约1%的人类DNA编码制造蛋白质的指令。近几十年的研究表明,大部分剩余的非编码遗传物质都含有调控元件,如启动子、增强子、沉默子和绝缘子,这些调控元件控制着编码DNA的表达方式。周博士解释说,序列是如何控制这些调控元件的功能的,目前还不清楚。


为了更好地理解这些调控成分,他和普林斯顿大学以及熨斗研究所的同事开发了一种深度学习模型Sei该技术精确地将这些非编码DNA片段分为40个“序列类”或工作——例如,作为干细胞或脑细胞基因活动的增强子。这40个序列类,使用来自以前研究基因组调控的近22000个数据集开发,覆盖了97%以上的人类基因组。此外,Sei可以根据40个序列类别中每个序列的预测活性对任何序列进行评分,并预测突变如何影响这些活动。


通过将Sei应用于人类遗传学数据,研究人员能够描述英国生物银行数据库中记录的47个性状和疾病的调控结构,并解释调控元件的突变如何导致特定的病理。这种能力可以帮助人们更系统地了解基因组序列变化与疾病和其他性状之间的联系。研究结果于本月发表。


5月,周博士报道另一种名为Orca的工具的开发,它可以根据染色体的序列预测DNA的3D结构。利用现有的DNA序列数据集和来自先前研究的结构数据集(揭示了分子的折叠、扭曲和旋转),周博士训练模型建立连接,并评估模型在不同长度尺度上预测结构的能力。


研究结果表明,Orca基于DNA序列高精度地预测了大小DNA结构,包括携带与各种健康状况相关的突变序列,包括一种白血病和肢体畸形。逆戟鲸还使研究人员产生了关于DNA序列如何控制其局部和大规模3D结构的新假设。


周博士说,他和他的同事计划使用Sei和Orca,这两种基因都可以在网络服务器上公开获取,并作为开源代码,进一步探索基因突变在导致疾病的分子和物理表现方面的作用——这项研究最终可能会导致治疗这些疾病的新方法。


参考:


陈敏敏,王佳佳,周杰。基于序列的人类基因调控活动全球图谱。Nat麝猫.2022年,54(7):940 - 949。doi:10.1038 / s41588 - 022 - 01102 - 2


从千碱基到染色体尺度的三维基因组结构的序列建模。Nat麝猫.2022年,54(5):725 - 734。doi:10.1038 / s41588 - 022 - 01065 - 4


本文已从以下地方重新发布材料.注:材料的长度和内容可能经过编辑。如需进一步信息,请联系所引用的来源。

广告
Baidu