神经网络裂缝mRNA的代码
俄勒冈州立大学的研究人员使用深度学习解读,核醣核酸酸有可能编码蛋白质。
递归神经网络的发达的大学科学与工程学院是一个重要的一步了解RNA,一个生命的基本,至关重要的分子。
解开的奥秘RNA意味着了解对人类健康和疾病之间的关系。
深入学习,一种机器学习不是基于特定于任务的算法,是一种强大的工具,用于解决难题。
“深度学习似乎可怕的一些人,但在一天结束的时候,它只是研究数字,”大卫·亨德里克斯说,该研究的主要作者。“这就像微积分和线性代数的工具,我们可以用它来学习生物模式。我们现在的测序数据量是巨大的,和深度学习是适合面对挑战与大量的相关数据和学习新生物规则描述这些分子的功能。”
从DNA、RNA转录其他核酸——如此命名是因为他们第一次被发现是在生物的细胞核——生产整个身体所需的蛋白质。
DNA包含一个人的遗传信息,充当信使RNA的制造过程提供信息的编码指令网站内的细胞。
一些rna功能分子从DNA转录,不是翻译成蛋白质。这些被称为非编码rna。
每一天,新的rna被发现,基因测序技术的进步,分子生物学家正面临着“洪流”的新记录注释从收集信息,亨德里克斯说。
这些庞大的数据集需要新方法,研究人员说,与联合任命助理教授生物化学/生物物理学和计算机科学。
亨德里克斯和他的同事做了一个封闭的神经网络训练非编码和信使RNA序列,然后把它松散的数据“学习的定义特征编码蛋白质的成绩单的。”
那样,显著改善现有最先进的方法预测蛋白质编码的潜力。
“这真令人兴奋,”亨德里克斯说。“与竞争项目,开发人员会告诉程序什么是开放阅读框,起始密码子是什么,什么是终止密码子。我们认为最好是有一个更新创的方法,神经网络可以学习独立。”
三个核苷酸序列密码子,核酸的基本结构单位。密码子像翻译之间的DNA和RNA的核苷酸和蛋白质合成背后的20种氨基酸。
与其他方法相比,俄勒冈州立大学团队开发的模型,称为mRNN,更好的以显著的优势在几乎每一个可用的指标。
“它不仅发现停止密码子,它区分真正的停止密码子与其他相匹配的三核苷酸停止密码子序列和公认的长程相关性,”亨德里克斯说。“它不会等待看到一个终止密码子,我们发现它决定之前终止密码子,从起始密码子200个核苷酸。学会了密码子的一个子集,是高度预测蛋白质编码的潜在当观察潜在的开放阅读框。”
亨德里克斯和他的同事们称这些特殊的密码子“抽搐”——translation-indicating密码子。
这篇文章被转载材料所提供的俄勒冈州立大学。注:材料可能是长度和内容的编辑。为进一步的信息,请联系引用源。
参考:山,s T。Kuintzle, R。Teegarden,。美林E。Danaee, P。,终于&亨德里克斯(无日期)。深度递归神经网络发现复杂的生物规则解释RNA编码蛋白质的潜力。核酸的研究。https://doi.org/10.1093/nar/gky567