新的机器学习方法分析复杂的蛋白质科学数据
科学家开发出了一种方法使用机器学习来更好的分析数据从一个强大的科学工具:核磁共振(NMR)。核磁共振数据可以使用的方法之一是理解蛋白质和人体的化学反应。核磁共振是密切相关的医疗诊断的磁共振成像(MRI)。
核磁共振光谱仪允许科学家描述的结构分子,如蛋白质,但它可以高度熟练的人类专家大量的时间来分析这些数据。这一新的机器学习方法可以分析数据更加迅速和准确。
在最近发表的一项研究自然通讯科学家们描述他们的过程,本质上是教计算机对量子蛋白质的性质,理清复杂的数据解析成个体,可读的图片。
“能够使用这些数据,我们需要分开成不同部分的功能分子和量化他们的特定属性,”说拉斐尔Bruschweiler这项研究的资深作者,俄亥俄研究学者和教授化学和生物化学在俄亥俄州立大学。”,在此之前,很难使用计算机来识别这些个性特征重叠时。”
这个过程中开发的大为李,该研究的第一作者,俄亥俄州立大学的研究科学家校园化学仪器中心从核磁共振光谱仪,教电脑扫描图像。这些图像,称为光谱,出现成百上千的高峰和低谷,,例如,可以显示改变蛋白质或复杂的代谢产物混合物在生物样品,如血液或尿液,在原子水平。NMR数据给重要的信息一个蛋白质的功能和重要的线索是什么发生在一个人的身体。
但是光谱分解成可读的山峰是很困难的,因为通常,山峰重叠。效果几乎是像一个山脉,那里更近、更大山峰模糊较小的,也可以把重要的信息。
“二维码认为读者在你的手机上:核磁共振光谱像一个分子的二维码——每个蛋白质都有自己的特定二维码,”Bruschweiler说。“不过,这些“二维码”的每个像素可以相互重叠在很大程度上如此。你的手机将无法破译。这个问题我们与核磁共振光谱和我们能够解决的教学计算机准确地阅读这些光谱。”
这个过程包括创建一个人工神经网络,一个多层次的网络节点的计算机使用分离和分析数据。
研究人员创建,网络,然后教导喂养光谱分析核磁共振光谱,已经被一个人进入计算机分析,告诉电脑以前已知的正确结果。教学过程的计算机分析光谱几乎是像教孩子阅读,研究人员开始使用非常简单的光谱。一旦计算机理解,研究人员转移到更复杂的设定。最终,他们美联储高度复杂的光谱的不同的蛋白质和鼠标尿液样本输入电脑。
使用深层神经网络的计算机,一直教分析光谱,可以解析出山峰的高度复杂的示例相同的精度作为人类专家,研究人员发现。,计算机速度和高度重复性良好。
参考:李dw,汉森,元C, Bruschweiler-Li L, Bruschweiler r .深选择是准确的反褶积的深层神经网络的复杂二维核磁共振光谱。自然通讯。2021;12 (1):5229。doi:10.1038 / s41467 - 021 - 25496 - 5。
本文从以下转载材料。注:材料可能是长度和内容的编辑。为进一步的信息,请联系引用源。