我们已经更新我们的隐私政策使它更加清晰我们如何使用您的个人资料。

我们使用cookie来提供更好的体验。你可以阅读我们的饼干的政策在这里。

广告

机器学习揭示未知细菌特性


想要一个免费的PDF版本的这个新闻吗?

完成下面的表格,我们将电子邮件您的PDF版本“机器学习揭示未知细菌功能”

听与
喋喋不休地说
0:00
注册免费听这篇文章
谢谢你!听这篇文章使用上面的球员。
阅读时间:

一个强大的新的机器学习技术可以应用于大型数据集在生物体的生物科学发现未知的特性和他们的基因,根据领导的研究小组的研究人员在宾夕法尼亚大学佩雷尔曼医学院。例如,技术学习特征的基因表达模式,当细菌暴露于低氧环境,并有效地识别变化发生在应对抗生素。

技术采用最近开发的算法称为“去噪autoencoder”,学会识别特性或复发模式在大型数据集没有被告知什么具体特性来寻找。在2012年,例如,当google资助人员类似的方法应用于随机选择YouTube图像,系统成功地学会了识别主要复发性特征的images-including猫。

在新的研究中凯西格林博士的助理教授系统药理学和转化疗法,与黛博拉·霍根合作,达特茅斯学院的博士,使用一个系统的去噪autoencoders分析许多大型数据集,衡量细菌中的基因表达在不同的条件。格林也是一个宾夕法尼亚大学生物医学信息学研究所高级研究员。

“系统学习了基本原则的细菌基因组学从这些数据,”格林说。“我们预计,这种方法将特别有用微生物学家研究细菌物种缺乏一个长达几十年的历史在实验室里研究。微生物学家可以使用这些模型来识别数据同意自己的知识和数据似乎指向不同的方向。”格林认为,这些数据可能的情况下建议新生物机制。

去年,格林和他的研究小组发表的第一个示范新方法在生物环境中:两种乳腺癌的基因表达数据集的分析。这项新研究是更远大,它覆盖了整个950基因表达阵列为绿脓bacteriumPseudomonas公开时,从109年截然不同的数据集。这种细菌是一个臭名昭著的病原体在医院和个人与囊性纤维化和其他慢性肺部疾病,通常很难治疗由于其高电阻标准抗生素疗法。

研究生第一作者杰Tan达特茅斯,格林,直到最近,他的实验室,开发格言(基因表达的分析利用去噪Autoencoders)和应用铜绿假单胞菌的数据集。数据只包括约5000的身份铜绿假单胞菌的基因,他们的表达水平在每个测量实验。目标是表明,这种“无监督”学习系统可以发现重要的铜绿假单胞菌的基因表达模式,阐明这些模式如何改变当细菌的环境发生变化时,例如在抗生素的存在。

即使模型建立与谚语相对simple-roughly相当于大脑只有几十个神经元没有麻烦学习集铜绿假单胞菌的基因倾向于一起工作或反对。的人员吃惊的是,格言系统还发现差异的主要实验室菌株从受感染患者分离的铜绿假单胞菌和紧张。”,变成了最强大的特性之一的数据,”格林说。

“我们被铜绿假单胞菌生长之间的相似之处与培养的肺上皮细胞和这些bacteriataken直接从肺囊性纤维化患者,”约翰·h·哈蒙德说,霍根实验室研究生合作这个项目。“我们正兴奋地继续使用谚语结合患者样本数据和使用实验室模型试验发现更好的方法来找到疗法治疗囊肿性纤维化肺感染。”

“我们认为,“大数据”的扩散提供了一个机会,通过使用非监督机器学习,寻找全新的东西在生物学,我们甚至不知道寻找,”格林说。

广告
Baidu